文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用x
条 记 录,以下是1-4
视图:
排序:
基于加权核非负矩阵分解的短文本聚类算法被引量:2
《计算机应用》2018年第8期2180-2184,2191,共6页曹大为 贺超波 陈启买 刘海 
广东省科技计划项目(2017A040405057;2017A030303074;2016A030303058;2015A020209178);广州市科技计划项目(201604016035;201807010043)~~
对互联网产生的大量短文本进行聚类分析具有重要的应用价值,但由于短文本存在特征稀疏和特征难以提取的问题,导致传统的文本聚类算法难以有效处理该问题。为了解决该问题,利用非负矩阵分解(NMF)模型提出基于加权核非负矩阵分解(WKNMF)...
关键词:核方法 短文本聚类 非负矩阵分解 核技巧 迭代优化求解 
改进的概率潜在语义分析下的文本聚类算法被引量:14
《计算机应用》2011年第3期674-676,693,共4页张玉芳 朱俊 熊忠阳 
中国博士后科学基金资助项目(20070420711);重庆市科委基金资助项目(2008BB2191)
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法...
关键词:文本聚类 概率潜在语义分析 参数初始化 潜在语义分析 
基于密度和最近邻的K-means文本聚类算法被引量:29
《计算机应用》2010年第7期1933-1935,共3页张文明 吴江 袁小蛟 
西北大学科研启动基金资助项目(PR08067);西北大学研究生自主创新基金资助项目(08YZZ35)
初始中心点的选择对于传统的K-means算法聚类结果影响较大,容易使聚类陷入局部最优解。针对这个问题,引入密度和最近邻思想,提出了生成初始聚类中心的算法Initial。将所选聚类中心用于K-means算法,得到了更好的应用于文本聚类的DN-K-me...
关键词:文本聚类 密度 最近邻 F度量 
一种优化初始中心点的K平均文本聚类算法被引量:6
《计算机应用》2005年第9期2037-2040,共4页赵万磊 王永吉 张学杰 李娟 
国家863计划资助项目(2001AA1131802002AA116080)
文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改...
关键词:优化 文本聚类 K平均 
检索报告 对象比较 聚类工具 使用帮助 返回顶部