文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-6
视图:
排序:
关键语义信息补足的深度文本聚类算法被引量:1
《计算机应用研究》2023年第6期1653-1659,共7页郑璐依 黄瑞章 任丽娜 白瑞娜 林川 
国家自然科学基金资助项目(62066007)。
针对大多数现有的深度文本聚类方法在特征映射过程中过于依赖原始数据质量以及关键语义信息丢失的问题,提出了一种基于关键语义信息补足的深度文本聚类算法(DCKSC)。该算法首先通过提取关键词数据对原始文本数据进行数据增强;其次,设计...
关键词:深度文本聚类 表征学习 自动编码器 自监督聚类 数据增强 
基于增强蜂群优化与K-means的文本聚类算法被引量:8
《计算机应用研究》2016年第8期2298-2302,共5页柯钢 
国家自然科学基金资助项目(61106019);东莞市社会科技发展项目(2013108101045)
针对文本数据维度较高、空间分布稀疏及其聚类效果不佳的问题,提出一种基于增强蜂群优化搜索与K-means的高效文本聚类算法。首先为蜂群算法引入公平操作与克隆操作来提高全局搜索的能力,公平操作提高了样本多样性,并增强了蜂群搜索能力...
关键词:蜂群算法 公平操作 克隆操作 多样性 局部提炼 文本聚类 
基于相对密度的多耦合文本聚类算法被引量:2
《计算机应用研究》2016年第6期1624-1627,共4页王洪佳 邢长征 王星 
国家自然科学基金资助项目(61402212)
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基于相对密度的聚类方法基础上,该算法根据相对密度越小文本相似性越小这一事实,将相对密度转换为文本相似度...
关键词:文本聚类 空间向量模型 相对密度 文本相似度 核心对象 
最大距离法选取初始簇中心的K-means文本聚类算法的研究被引量:109
《计算机应用研究》2014年第3期713-715,719,共4页翟东海 鱼江 高飞 于磊 丁锋 
国家语委"十二五"科研规划项目(YB125-49);国家教育部科学技术研究重点项目(212167);中央高校基本科研业务费专项资金科技创新项目(SWJTU12CX096);西藏自治区大学生创新性实验训练计划项目(2011CX051)
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实...
关键词:K-MEANS聚类算法 最大距离 文本聚类 文本距离 测度函数 F度量值 
一种面向网络话题发现的增量文本聚类算法被引量:16
《计算机应用研究》2011年第1期54-57,共4页殷风景 肖卫东 葛斌 李芳芳 
国家自然科学基金资助项目(60903225)
为满足网络舆情监控系统中话题发现的需要,并克服经典single-pass算法处理网络文本聚类中受输入顺序影响和精度较低的主要不足,提出了ICIT算法,继承了single-pass算法的简单原理,保证了网络文本聚类的实时性;通过正文分词时标注词性选...
关键词:话题发现 文本聚类 增量聚类 准确度 ICIT算法 
基于关联规则的文本聚类算法的研究被引量:5
《计算机应用研究》2008年第4期986-988,共3页曲守宁 王钦 邹燕 朱强 
国家自然科学基金资助项目(60573065);国家"863"计划资助项目(2002AA4Z3240);教育部的世行贷款--21世纪初高等教育教学改革资助项目(1283B0843)
K-均值聚类算法是目前一种较好的文本分类算法,算法中的相似度计算通常基于词频统计,小文档或简单句子由于词频过小,使用该算法聚类效果较差。为此,提出了一种基于词语关联度的相似度计算算法,对简单文档集执行关联规则算法,得出基于关...
关键词:文本挖掘 K-均值聚类 关联规则 权重 
检索报告 对象比较 聚类工具 使用帮助 返回顶部