潜在语义索引

作品数:97被引量:347H指数:11
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:林鸿飞王立宏宋宜斌曾雪强秦洋更多>>
相关机构:大连理工大学东北大学哈尔滨工业大学烟台大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划山东省自然科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-8
视图:
排序:
文本分类中基于K-Sprinkling的特征提取方法被引量:2
《计算机工程》2017年第12期141-146,共6页李惠富 陆光 景维鹏 
黑龙江省自然科学基金(F201201);林业公益性行业科研专项(201504307)
传统的特征提取方法大多注重类别对特征词的作用,不能很好地表达样本对类别的影响。为此,对样本的类别贡献问题进行研究。针对Sprinkling特征提取方法中未考虑样本对类别的贡献度问题,提出一种基于K-Sprinkling的特征提取方法。综合考...
关键词:特征提取 样本隶属度 样本紧密度 潜在语义索引 贡献度 
基于成对约束的主动半监督文本聚类被引量:4
《计算机工程》2011年第13期183-186,共4页钟将 刘龙海 梁传伟 
国家科技支撑计划基金资助重大项目(2008BAH37B04);重庆市自然科学基金资助项目(CSTC2010BB2046;CSTC2009BB2184);"211工程"三期建设基金资助项目(S-10218)
在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法。利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类。...
关键词:文本聚类 半监督聚类 潜在语义索引 成对约束 
基于非负矩阵分解的中文文本主题分类被引量:3
《计算机工程》2009年第13期26-27,54,共3页张磊 冯晓森 项学智 
国家自然科学基金资助项目"基于Lattice的汉语语音主题分类方法研究"(60702053);国家自然科学基金资助项目"基于子词网格的汉语语音检索关键技术研究"(60575030)
提出基于非负矩阵分解(NMF)的中文文本主题分类方法,应用NMF算法分解词-文本矩阵获取词之间的相关性,有效地解决同义词、多义词的影响。实验结果表明,与基于奇异值分解的潜在语义索引方法相比,该方法计算速度快、占用存储空间较少。在...
关键词:主题分类 非负矩阵分解 潜在语义索引 
一种大规模数据的快速潜在语义索引被引量:10
《计算机工程》2009年第15期35-37,40,共4页卫威 王建民 
潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一...
关键词:潜在语义索引 降维 特征选择 特征提取 
基于潜在语义差异的医学网页聚类被引量:2
《计算机工程》2008年第19期64-66,共3页米晓芳 秦洋 王立宏 宋宜斌 
国家自然科学基金资助项目(60473115);山东省自然科学基金资助项目(Y2006G22)
采用潜在语义索引的全局模型和局部模型表示医学网页时,模糊聚类结果的类间包含度很大。该文提出一种新的潜在语义差异模型,将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用FCM算法进行聚类并计算类间...
关键词:潜在语义索引 差异模型 文本挖掘 FCM聚类 包含度 
基于LSI和SVM的文本分类研究被引量:8
《计算机工程》2007年第15期217-219,共3页刘美茹 
文本分类技术是文本数据挖掘的基础和核心,是基于自然语言处理技术和机器学习算法的一个具体应用。特征选择和分类算法是文本分类中两个最关键的技术,该文提出了利用潜在语义索引进行特征提取和降维,并结合支持向量机(SVM)算法进行多类...
关键词:特征提取 潜在语义索引 支持向量机 
基于Rough集潜在语义索引的Web文档分类被引量:7
《计算机工程》2004年第13期3-5,共3页何明 冯博琴 傅向华 
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约...
关键词:粗糙集 潜在语义索引 WEB文档分类 信息过滤 信息检索 
基于文本的内容过滤算法的比较被引量:11
《计算机工程》2002年第11期9-10,113,共3页何静 刘海燕 张惠民 
内容过滤技术在信息检索技术的基础上发展起来,并逐渐形成了自身的理论体系。文章总结了目前常用的几种内容过滤算法,并对它们的优缺点进行了分析和比较,为不同领域采用适当的内容过滤算法提供了思路。
关键词:文本 内容过滤算法 潜在语义索引 神经网络 用户模板 信息查询 网络安全 计算机网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部