文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-5
视图:
排序:
结合语义改进的K-means短文本聚类算法被引量:14
《计算机工程与应用》2016年第19期78-83,共6页邱云飞 赵彬 林明明 王伟 
国家自然科学基金(No.71371091);辽宁省高等学校杰出青年学者成长计划(No.LJQ2012027);辽宁省教育厅一般项目(No.L2013131)
针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集...
关键词:文本挖掘 短文本聚类 K-MEANS算法 最大频繁词集 知网 语义相似度 
一种CF树结合KNN图划分的文本聚类算法被引量:5
《计算机工程与应用》2015年第6期114-119,共6页仰孝富 齐建东 吉鹏飞 朱文飞 
十二五科技项目面向外文科技文献信息的知识组织体系建设与应用示范(No.2011BAH10B04);国家林业局重点项目
为了提升文本聚类效果,改善传统聚类算法在参数设定,稳定性等方面存在的不足,提出新的文本聚类算法TCBIBK(a Text Clustering algorithm Based on Improved BIRCH and K-nearest neighbor)。该算法以BIRCH聚类算法为原型,聚类过程中除...
关键词:文本聚类 向量空间模型 传统的且非常高效的层次聚类算法(BIRCH) K最近邻 
概念向量文本聚类算法被引量:11
《计算机工程与应用》2011年第35期155-157,209,共4页白秋产 金春霞 周海岩 
江苏省科技攻关项目(No.BE2006357)
为了解决基于传统关键词的文本聚类算法没有考虑特征关键词之间的相关性,而导致文本向量概念表达不够准确,提出基于概念向量的文本聚类算法TCBCV(Text Clustering Based on Concept Vector),采用HowNet的概念属性,并利用语义场密度和义...
关键词:知网 概念语义场 义原抽取 概念向量 文本聚类 
基于Isomap的中文短信文本聚类算法被引量:2
《计算机工程与应用》2009年第34期144-146,共3页刘金岭 
给出的算法思想是首先计算出中文短信的相似度,再通过使用Isomap方法得到短信在语义空间中的嵌入情况,然后将短信在低维嵌入上进行聚类分析。该算法克服了短信的传统聚类分析在表示层次上遇到的困难,也克服了词频统计法不能将内容意思...
关键词:短信聚类 ISOMAP算法 语义空间 
基于LSA降维的RPCL文本聚类算法被引量:5
《计算机工程与应用》2006年第23期138-140,共3页高茂庭 王正欧 
国家自然科学基金资助项目(编号:60275020);上海市教委科研项目(编号:04FB22);上海海事大学重点学科建设项目(编号:XL0101)
文本聚类中,存在诸如文本特征空间维数巨大、聚类的数目不能事先确定等问题。隐含语义分析方法可以对文本特征空间作降维处理并有效地凸现出文本和词条之间的语义关系;次胜者受罚竞争学习规则可以进行有效的聚类并自动确定适当的聚类数...
关键词:文本聚类 次胜者受罚竞争学习 隐含语义分析 聚类分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部