文本聚类

作品数:1001被引量:4944H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章徐森章成志秦永彬王正欧更多>>
相关机构:北京邮电大学贵州大学哈尔滨工业大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用与软件x
条 记 录,以下是1-10
视图:
排序:
基于主题词向量中心点的K-means文本聚类算法
《计算机应用与软件》2024年第10期282-286,318,共6页季铎 刘云钊 彭如香 孔华锋 
国家重点研发计划项目(2018YFC0830401);辽宁网络安全执法协同创新中心开放课题。
K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策...
关键词:K-MEANS 初始点 决策图 迭代类中心 主题词向量 
结合指数函数改进的随机近邻嵌入式短文本聚类
《计算机应用与软件》2024年第3期226-232,共7页汪晓晨 宋叔尼 
国家自然科学基金项目(11801065)。
近年来深度学习在短文本聚类方面发挥巨大作用,最近提出的短文本聚类(Short Text Clustering, STC)算法在此方面取得不错的成效。为进一步提高聚类准确率并优化算法性能,基于指数函数提出改进的随机近邻嵌入算法。该算法用指数函数度量...
关键词:短文本聚类 深度算法 随机近邻嵌入 特征提取 
基于改进灰狼优化的文本聚类多阶段特征选择算法被引量:4
《计算机应用与软件》2023年第3期316-324,共9页刘泓铄 王诗瑶 周灵鸽 张建锋 
陕西省重点研发计划项目(2019NY-164)。
为了降低文本特征维度,提高聚类准确度,提出改进灰狼优化多阶段特征选择与特征提取算法。结合平均绝对差和平均中位数作相关特征选择,利用合并/交叉融合特征子集;根据余弦相似性作特征提取,得到初选特征子集;基于初选特征子集,设计改进...
关键词:特征选择 特征提取 二进制灰狼优化算法 反向学习 文本聚类 
中文专利数据可视化分析系统研究与设计被引量:1
《计算机应用与软件》2023年第1期24-29,共6页陈挺 徐胜捷 陈龙 陆间 张丽丽 
国家级大学生创新创业训练计划资助项目(201910294078)。
现有的专利分析系统在可视化方面存在诸多不足,针对中文专利的可视化分析工具更是少之又少。结合文本挖掘技术,设计并实现“中文专利数据可视化分析系统”,具有专利态势分析、专利聚类分析、专利引证分析三种分析功能,多角度分析了中文...
关键词:专利分析 可视化 文本聚类 系统设计 
融入混沌与对立学习机制的二进制粒子群特征选择算法被引量:3
《计算机应用与软件》2022年第10期274-284,306,共12页袁明锋 步中华 王强 
山东省自然科学基金项目(2018080712);教育部产学合作项目(2017HX00223)。
为了实现特征空间降维,提高文本聚类准确性,提出一种融入混沌与对立学习的二进制粒子群优化特征选择算法。设计了新的词条权重计算方法,将文本数据表达为矢量空间模型;提出改进二进制粒子群算法求解特征选择问题,引入混沌系统和对立学...
关键词:特征选择 二进制粒子群优化 混沌映射 对立学习 文本聚类 
基于核函数的改进k-means文本聚类被引量:12
《计算机应用与软件》2019年第9期281-284,301,共5页张国锋 吴国文 
通过对传统k-means算法优缺点的研究分析,提出一种改进的k-means聚类算法。随机初始化k/2个簇心,划分最大的簇并删除空簇,在更新簇心的同时判断簇心位置的合理性;及时对簇心做出修改,使得最后聚类出的k个簇中不会出现空簇;使用高斯核函...
关键词:K-MEANS 高斯核函数 TF-IDF 文本聚类 
基于弱监督深度学习的文本聚类算法及应用被引量:2
《计算机应用与软件》2019年第4期171-177,共7页谭敏 张宏源 张海超 
国家自然科学基金青年基金项目(61602136)
围绕基于用户点击数据的文本聚类展开研究。利用点击数据将查询文本表征为图像点击特征图,并在此上训练深度点击模型。为了应对文本噪声,引入可刻画文本可靠性的权重,提出基于弱监督深度学习的文本聚类算法来迭代更新文本权重和深度模...
关键词:图像识别 深度聚类 用户点击数据 查询合并 弱监督学习 
一种基于关键词的微博话题聚类算法被引量:7
《计算机应用与软件》2018年第1期264-268,共5页林丹 刘建明 谷志瑜 
国家自然科学基金项目(61262074);广西可信软件重点实验室课题;广西高校优秀人才资助计划(桂教人201065);桂林电子科技大学计算机软件创新团队项目;桂林电子科技大学研究生创新项目(YJCXS201542)
由于微博跟现实生活有着密不可分的联系,微博的话题聚类可以发掘人们所关注的话题,有利于引导公众舆情。由于传统的文本聚类方法主要适用于长文本,LDA(Latent Dirichlet Allocation)话题模型是一个比较成熟也比较全面的话题聚类方法,实...
关键词:微博 主题模型 文本聚类 关联词算法 
结合权重因子和特征向量改进的混合聚类方法被引量:2
《计算机应用与软件》2015年第11期264-268,共5页董跃华 郭士串 
江西省研究生创新专项资金项目(YC2013-S198)
针对特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性,首先通过特征词权重因子(WF)和特征向量结合位置权重信息的方法进行文本预处理,在此基础上通过遗传控制因子(GCF)改进遗传K-均值文本聚类算法。在个体进行交叉和变异...
关键词:文本聚类 权重因子 特征向量 遗传控制因子 遗传K-均值 
基于马氏距离的文本聚类算法在自动阅卷系统中的应用被引量:6
《计算机应用与软件》2015年第4期80-82,86,共4页李翠霞 谭营军 孔金生 
河南省教育厅自然科学研究计划项目(2011C510002)
基于欧氏距离的传统模糊划分聚类算法较适用于球型结构的聚类。将其应用于维度较高的文本聚类时,准确率和效率均有所下降。为解决这一问题,提出一种基于马氏距离的文本聚类算法。该算法可发现非球形结构的类簇,在不需要先验知识的情况下...
关键词:聚类 文本聚类 模糊C均值 欧氏距离 马氏距离 自动阅卷 
检索报告 对象比较 聚类工具 使用帮助 返回顶部