文本聚类

作品数:1001被引量:4944H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章徐森章成志秦永彬王正欧更多>>
相关机构:北京邮电大学贵州大学哈尔滨工业大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与设计x
条 记 录,以下是1-10
视图:
排序:
基于改进磷虾群算法的多目标文本聚类方法被引量:2
《计算机工程与设计》2022年第6期1694-1703,共10页菊花 
教育部人文社科研究规划基金项目(20XJA740002)。
提出融合K均值与改进磷虾群算法的多目标文本聚类算法。利用K均值的局部快速寻优和改进磷虾群的全局搜索能力,以K均值聚类解作为改进磷虾群的初始种群,引入遗传交叉和变异改善个体多样性,提升全局搜索能力;通过磷虾种群的诱导运动、觅...
关键词:文本聚类 K均值算法 磷虾群算法 遗传算子 多目标聚类 
基于和声搜索机制的特征选择与文本聚类分析被引量:1
《计算机工程与设计》2022年第2期472-478,共7页王永刚 李靖 王文慧 曹传剑 王晓燕 
山东省高等学校青创人才引育计划建设团队基金项目(201901)。
针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法。以词频逆文本频率指数为目标函数评估特征词条;在初始文档集中通过和声搜索的记忆考虑、纵向倾角调整和随机选择3种特征选择新解更新规则,迭代搜索最优特...
关键词:特征选择 文本聚类 和声搜索机制 K均值文本聚类 特征子集 
基于二进制灰狼优化的特征选择及文本聚类被引量:10
《计算机工程与设计》2021年第9期2526-2535,共10页王琛 董永权 
国家自然科学基金项目(61100167);江苏省自然科学基金项目(BK2011204)。
提出基于二进制灰狼优化的特征选择与文本聚类算法。为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并...
关键词:文本聚类 二进制灰狼算法 K均值聚类 特征选择 选择合并 词条权重 
融合化学反应优化与K均值的文本数据聚类
《计算机工程与设计》2021年第8期2248-2256,共9页王琛 董永权 
国家自然科学基金项目(61100167);江苏省自然科学基金项目(BK2011204)。
提出一种融合化学反应优化与K均值的文本聚类算法。结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4...
关键词:文本聚类 化学反应算法 K均值聚类 矢量空间模型 适应度函数 
融入新的特征选择机制的文本数据聚类算法被引量:2
《计算机工程与设计》2021年第3期734-741,共8页田夏利 熊莹 
华夏学院科研基金项目(HX20120201)。
文本信息中包括许多无用特征,这种噪声特征会影响文本聚类效果,为此提出一种基于粒子群优化的文本特征选择算法。利用词频逆文本频率指数为目标函数评估每个文档的文本特征,从初始文档数据集中求解新的有用特征最优子集;以该最优有用特...
关键词:特征选择 文本聚类 粒子群优化 K均值文本聚类 目标函数 
基于用户权威度与热度分配聚类的微博热点发现被引量:1
《计算机工程与设计》2020年第3期664-669,共6页曹春萍 黄伟 
上海市自然科学基金项目(15ZR1429100);国家自然科学基金项目(61402288)。
针对微博热点算法未合理进行微博文本和微博用户相结合的问题,提出基于用户权威度与热度分配聚类的微博热点挖掘算法。对微博文本进行分词,得到特征词并使用改进TF-IDF为特征词分配权重,通过权重大小进行降序排序,对微博文本进行聚类分...
关键词:微博数据 特征权重 文本聚类 用户权威度 热度分配 
基于词向量和增量聚类的短文本聚类算法被引量:14
《计算机工程与设计》2019年第10期2985-2990,3055,共7页杨波 杨文忠 殷亚博 何雪琴 袁婷婷 刘泽洋 
国家自然科学基金项目(U1603115、61262087);国家自然科学基金重点基金项目(U1435215);新疆维吾尔自治区自然科学基金项目(2017D01C042)
由于微博短文本的高维稀疏和传统Single-Pass聚类算法对文本数据顺序敏感等问题,导致短文本聚类准确率较低。针对上述问题提出一种基于词向量和增量聚类的短文本聚类算法(improved single-pass algorithm based on word embedding,ISWE...
关键词:短文本 词向量 文本表示 空间金字塔池化 增量聚类 
结合类别与语义贡献度的特征权重计算方法被引量:5
《计算机工程与设计》2018年第6期1619-1622,共4页王勇 王李福 邹辉 何养明 
国家自然科学基金项目(61173184)
为解决在文本处理实际应用中,各文本通常没有包含明确的类别信息,以及在传统的基于向量空间模型的TFIDF方法中特征项权重计算时,缺乏语义关系和类别区分度的问题,对特征项权重计算方法进行改进。提出特征项的语义贡献度,通过结合模糊聚...
关键词:模糊聚类 信息熵 文本聚类 类别区分度 向量空间模型 
基于密度峰值优化的K-means文本聚类算法被引量:26
《计算机工程与设计》2017年第4期1019-1023,共5页田诗宵 丁立新 郑金秋 
国家自然科学基金项目(60975050);中央高校基本科研业务费专项基金项目(2452015197;2452015194;2452015200)
传统K-means算法中初始质心选定的随机性可能使算法陷入局部最优解,使聚类结果不够准确。改进初始质心的选择算法,为各样本点引入局部密度指标,根据其局部密度分布情况,选取处于密度峰值的点作为初始质心,得到稳定的离收敛质心很近的初...
关键词:文本聚类 密度峰值 F度量 K均值 向量化 
双重遗传算法在文本聚类中的应用
《计算机工程与设计》2016年第9期2435-2439,2458,共6页文静 曹妍 牟向伟 
辽宁省创新团队基金项目(LT2011007);中国博士后科学基金项目(2014M551063);辽宁省教育厅科技研究基金项目(L2014203);辽宁省社会科学规划基金项目(L14BGL012);中央高校基本科研业务费专项基金项目(3132015050);中国博士后科学基金项目(2015M571292);中央高校基本科研业务费基金项目(3132015049)
为提高文本聚类效果,将影响聚类效果的两大因素聚类数目和初始中心点作为自变量,聚类结果的适应度作为因变量,利用双重遗传算法控制两大自变量,提出TCDGK算法模型。引入经典的k-means聚类算法获得不同初始中心点下的聚类结果,针对内外...
关键词:双重遗传算法 聚类紧密度 分层编码 K-MEANS算法 文本聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部