文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-5
视图:
排序:
一种基于谱分割的短文本聚类算法被引量:1
《计算机工程》2016年第8期178-182,共5页李晓红 谢蒙 马慧芳 何廷年 
国家自然科学基金资助项目(61163039;61363058);甘肃省青年科技基金资助项目(1308TJY085;145RJYA259);中国科学院计算技术研究所智能信息处理重点实验室开放基金资助项目(IIP2014-4)
短文本具有稀疏高维的特点,现有聚类算法在大规模短文本上的聚类精度较低且效率低下。针对该问题,提出一种以谱聚类理论作支撑,基于谱分割准则RMcut的新聚类算法。依据谱聚类理论,将短文本集合构建成一张带权无向图,并计算得到文档-文...
关键词:短文本 相似度矩阵 无向带权图 RMcut准则 聚类算法 
基于非负矩阵分解的双重约束文本聚类算法被引量:6
《计算机工程》2011年第24期161-163,共3页马慧芳 赵卫中 史忠植 
国家自然科学基金资助项目(61105052;61163039);西北师范大学青年教师科研能力提升计划基金资助项目"面向Web的主题建模关键技术研究"(NWNU-LKQN-10-1);湘潭大学博士启动基金资助项目(10QDZ42)
提出一种基于非负矩阵分解(NMF)的双重约束文本聚类算法。在正交三重NMF模型中,加入文本空间的成对约束信息和词空间的类别约束信息,将不同的特征词项进行分类。利用迭代规则对原始的词-文档矩阵进行分解,获得文本聚类结果。与多种传统...
关键词:半监督聚类 非负矩阵分解 成对约束 类别约束 
基于蚁群算法的文本聚类算法被引量:5
《计算机工程》2010年第8期206-207,210,共3页马世霞 刘丹 贾世杰 
河南省基础与前沿技术研究计划基金资助项目(082300410390);河南省教育厅自然科学研究基金资助项目(2007520009)
针对目前文本检索后的相关反馈信息较少用于文本聚类中的问题,根据蚂蚁觅食聚类算法的思想,将文本检索后的相关反馈信息应用到文本聚类过程中,提出一种基于蚁群算法的文本聚类算法。分析簇的结构及其生成过程,论述聚类中簇合并的规则及...
关键词:文本聚类 蚁群算法  相似度 
基于语义的高质量中文短信文本聚类算法被引量:30
《计算机工程》2009年第10期201-202,205,共3页刘金岭 
现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文...
关键词:短信文本 语义 概念相似度 
基于向量空间模型的文本聚类算法被引量:50
《计算机工程》2008年第18期39-41,44,共4页姚清耘 刘功申 李翔 
国家自然科学基金资助项目(60502032;60402019);教育部新世纪优秀人才支持计划基金资助项目(NCET-06-0393)
文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用。该文探讨了基于向量空间模型的文本聚类方法,提出了一种文本聚类的改进算法——LP算法。同时,基于语料库的实际聚类效果,就维度确定、特征选择等方面提出优化方案。...
关键词:向量空间模型 文本聚类 语料库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部