文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与科学x
条 记 录,以下是1-6
视图:
排序:
基于改进相似度与类中心向量的半监督短文本聚类算法被引量:1
《计算机工程与科学》2018年第9期1710-1716,共7页李晓红 冉宏艳 龚继恒 颜丽 马慧芳 
国家自然科学基金(61163039);甘肃省青年科技基金(1606RJYA269;145RJYA259);甘肃省高等学校科研项目(2015A-008);西北师范大学青年教师科研能力提升计划项目(NWNU-LKQN-14-5;NWNU-LKQN-16-20)
通过分析现有短文本聚类算法的缺陷,提出了一种基于改进相似度与类中心向量的半监督短文本聚类算法。首先,定义强类别区分度词,利用已加标数据的类别信息提取并构造强类别区分度词集合,并对基于初始特征的余弦相似度和基于强类别区分度...
关键词:强类别区分度 相似度 类中心向量 半监督聚类 短文本 
基于核心词项平均划分相似度的短文本聚类算法
《计算机工程与科学》2017年第8期1562-1569,共8页马慧芳 朱志强 成玉丹 贾俊杰 
国家自然科学基金(61363058);甘肃省青年科技基金(145RJYA259);甘肃省自然科学研究基金(145RJZA232;150RJZA127);中国科学院计算技术研究所智能信息处理重点实验室开放基金(IIP2014-4);2016本科生创新能力提升计划--学术科技创新团队资助项目;2016年甘肃省大学生创新创业训练计划(201610736040;201610736041)
针对短文本特征极度稀疏、上下文依赖性强等特点,以自顶向下的策略,提出一种基于核心词项平均划分相似度的短文本聚类算法CTMPS。该方法首先在整个短文本语料库中计算词项之间的概率相关性,以此为基础对短文本中词项进行加权,将权值较...
关键词:短文本聚类 核心词项 平均划分相似度 概率相关性  
一种结合GAAC和K-means的维吾尔文文本聚类算法被引量:5
《计算机工程与科学》2013年第7期149-155,共7页吐尔地.托合提 艾海麦提江.阿布来提 米也塞.艾尼玩 艾斯卡尔.艾木都拉 
国家自然科学基金资助项目(61063022;61262062;61163033);新疆维吾尔自治区高技术研究发展计划项目(201212124);新疆维吾尔自治区高校科研计划重点项目(XJEDU2012I11);教育部新世纪优秀人才支持计划资助项目(NCET-10-0969)
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响。在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分...
关键词:维吾尔文 文本聚类 K—means GAAC 结合算法 
位置加权文本聚类算法被引量:6
《计算机工程与科学》2011年第6期154-158,共5页金春霞 周海岩 
江苏省科技攻关项目(BE2006357)
文本聚类是自然语言处理研究中一项重要研究课题,文本聚类技术广泛地应用于信息检索、Web挖掘和数字图书馆等领域。本文针对特征词在文档中的不同位置对文档的贡献大小不同,提出了基于特征词的位置加权文本聚类改进算法——TCABPW。通...
关键词:文本聚类 文本向量 特征选择 位置加权 簇间相似度 
基于最优适值保留的蚁群文本聚类算法被引量:2
《计算机工程与科学》2010年第5期79-81,共3页刘晓勇 
广东省高校优秀青年创新人才培育基金资助项目(LYM08074);广东技术师范学院自然科学基金资助项目(08kjy02)
蚁群聚类最早是由Deneubourg提出的一种仿生聚类方法,在聚类分析中得到广泛应用。本文在该算法的基础上提出一种基于精英适值保留的蚁群聚类算法,在一般蚁群聚类算法中引入精英保留机制,在每次算法的迭代中保留一定数量的优良解进入到...
关键词:文本聚类 蚁群算法 蚁群聚类 文本挖掘 
一种基于人工免疫网络的文本聚类算法被引量:1
《计算机工程与科学》2007年第10期17-19,49,共4页童健华 谭洪舟 
国家自然科学基金资助项目(60575006)
本文构造了一种能准确描述文本之间相似性(亲和力)的新方法,并在此基础上提出了一种基于人工免疫网络的文本聚类算法。仿真结果表明,与传统的文本聚类算法相比,新算法不仅能自动发现新类,而且具有聚类精度更高、数据压缩比更大、与输入...
关键词:亲和力计算 人工免疫网络 文本聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部