中文文本聚类

作品数:27被引量:163H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:徐建锁李若鹏马国俊杨彩莲李艳梅更多>>
相关机构:上海交通大学西安电子科技大学南开大学常州大学更多>>
相关期刊:《计算机技术与发展》《计算机工程与设计》《计算机与数字工程》《中文信息学报》更多>>
相关基金:国家自然科学基金江苏省自然科学基金湖南省教育厅科研基金中国地震局地震科技星火计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-2
视图:
排序:
一种基于小生境遗传算法的中文文本聚类新方法被引量:4
《计算机工程》2006年第6期206-208,共3页赵亚琴 周献中 
针对传统c-均值等算法在文本聚类中的缺陷,提出了一种基于小生境遗传算法的中文文本聚类新方法,将文本集的聚类问题转化为多峰函数的优化问题。以多峰函数的峰值代表文本的聚类中心,聚类的数目不必预先给定。描述了该聚类方法实现文本...
关键词:排挤小生境 文本聚类 多峰函数 密度估计 
TCBLSA:一种中文文本聚类新方法被引量:15
《计算机工程》2004年第5期21-22,37,共3页王国勇 徐建锁 
国家自然科学基金资助项目(60275020)
根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异...
关键词:文本聚类 隐含语义分析 奇异值分解 向量空间模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部