文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机系统应用x
条 记 录,以下是1-4
视图:
排序:
面向热点话题检测的增量文本聚类算法被引量:4
《计算机系统应用》2022年第9期280-286,共7页郭莹 薛涛 胡伟华 
国家社会科学基金(18XYY010)。
针对传统的Single-Pass聚类算法对数据输入顺序过于敏感和准确率较低的问题,提出一种以子话题为粒度,考虑新闻文本动态性、时效性和上下文语义特征的增量文本聚类算法(SP-HTD).首先通过解析LDA2Vec主题模型,联合训练文档向量和词向量,...
关键词:Single-Pass 文本表示 文本聚类 文本相似度 热点话题检测 
基于频繁模式的长尾文本聚类算法被引量:1
《计算机系统应用》2019年第4期139-144,共6页宋中山 张广凯 尹帆 帖军 
国家科技支撑计划项目子课题(2015BAD29B01);农业部软科学研究课题(D201721);中央高校基本科研业务费专项资金(CZY18016)~~
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collabora...
关键词:文本聚类 长尾现象 频繁模式 K中心点算法 
改进特征权重的短文本聚类算法被引量:2
《计算机系统应用》2018年第9期210-214,共5页马存 郭锐锋 高岑 孙咏 
短文本的研究一直是自然语言处理领域的热门话题,由于短文本特征稀疏、用语口语化严重的特点,它的聚类模型存在维度高、主题聚焦性差、语义信息不明显的问题.针对对上述问题的研究,本文提出了一种改进特征权重的短文本聚类算法.首先,定...
关键词:特征权重 情感分析 词向量 RWMD距离 
基于K-means的文本聚类算法被引量:9
《计算机系统应用》2009年第10期85-87,共3页毛嘉莉 
四川省教育厅重点科研项目(07ZA121)
针对K-means算法容易收敛到局部最优以及对初值的依赖性,基于多次采样一次预聚类搜索初始聚类中心的思想,提出了一种改进的K-means文本聚类方法。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。
关键词:K—Means算法 文本聚类 向量空间模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部