文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机与数字工程x
条 记 录,以下是1-3
视图:
排序:
融合密度和划分的文本聚类算法
《计算机与数字工程》2024年第1期178-183,共6页刘龙 刘新 蔡林杰 唐朝 
网络犯罪侦查湖南省普通高校重点实验室开放课题项目(编号:2018WLFZZC003)资助。
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中...
关键词:文档聚类 BERT K-均值算法 密度 最远距离 
一种高效的分布式相似短文本聚类算法被引量:4
《计算机与数字工程》2016年第5期895-900,943,共7页原默晗 唐晋韬 王挺 
国家自然科学基金项目(编号:61200337)资助
近似重复在微博等网络短文本中十分常见,查找和消除近似重复对于网络信息的有效处理具有非常重要的意义。论文针对相似短文本聚类的特点,在改进shingling、最小哈希和局部敏感哈希算法相结合的文件相似检测方法的基础上,设计了一个高效...
关键词:文本聚类 最小哈希 局部敏感哈希 shingling SPARK 
基于优化初始中心点的K-means文本聚类算法被引量:8
《计算机与数字工程》2011年第10期30-31,共2页张世博 
K-means算法终止于一个局部最优状态,所以初始中心点的选择会在很大程度上影响其聚类效果。该文针对K-means算法所存在的问题,提出了一种优化初始中心点的算法。实验表明可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。
关键词:K均值 聚类 初始中心点 
检索报告 对象比较 聚类工具 使用帮助 返回顶部