文本聚类算法

作品数:129被引量:751H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章金春霞马慧芳秦永彬姚清耘更多>>
相关机构:中山大学西安电子科技大学西北师范大学贵州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术—控制理论与控制工程x
条 记 录,以下是1-10
视图:
排序:
融合密度和划分的文本聚类算法
《计算机与数字工程》2024年第1期178-183,共6页刘龙 刘新 蔡林杰 唐朝 
网络犯罪侦查湖南省普通高校重点实验室开放课题项目(编号:2018WLFZZC003)资助。
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中...
关键词:文档聚类 BERT K-均值算法 密度 最远距离 
卷积神经网络在敏感客户模型的应用研究
《中国质量》2023年第7期107-111,共5页黎伟健 胡莉琼 朱凯亮 陈钦顺 
研究基于卷积神经网络的文本聚类算法,并在此算法基础上生成敏感客户模型。一是扩大客户声音样本:从10086热线投诉拓展到总部服务标签、智能客服交互记录、满意度短信调研客户反馈、端内用后即评客户声音、互联网社区客户评论等样本。...
关键词:卷积神经网络 文本聚类算法 敏感客户模型 拦截 
关键语义信息补足的深度文本聚类算法被引量:1
《计算机应用研究》2023年第6期1653-1659,共7页郑璐依 黄瑞章 任丽娜 白瑞娜 林川 
国家自然科学基金资助项目(62066007)。
针对大多数现有的深度文本聚类方法在特征映射过程中过于依赖原始数据质量以及关键语义信息丢失的问题,提出了一种基于关键语义信息补足的深度文本聚类算法(DCKSC)。该算法首先通过提取关键词数据对原始文本数据进行数据增强;其次,设计...
关键词:深度文本聚类 表征学习 自动编码器 自监督聚类 数据增强 
基于Laplacian图谱的短文本聚类算法被引量:2
《电子学报》2021年第9期1716-1723,共8页孟海宁 冯锴 朱磊 张贝贝 童新宇 黑新宏 
国家自然科学基金(No.61602375,No.61773313)。
提出基于词频处理的Laplacian图谱聚类算法,以解决短文本数据维数高、特征稀疏等问题.首先采用词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)方法,将短文本数据集映射到文本向量空间得到词频权值矩阵;其次利用...
关键词:Laplacian图谱 词频-逆文本频率指数 短文本聚类 向量空间模型 数据降维 特征权值 
基于蚁群算法的文本聚类算法的参数优化被引量:5
《北京信息科技大学学报(自然科学版)》2016年第3期50-54,共5页姚兴仁 赵刚 
北京市科委重大项目科技计划课题(D151100004215003)
针对蚁群文本聚类算法最优参数选取这一问题,根据蚁群聚类算法原理,分析扩展蚁群聚类算法的各个参数,通过理论分析和仿真实验选取对文本聚类效果影响较大的若干参数;重点分析聚类过程中算法参数的变化对文本聚类效果的影响,得出每个参...
关键词:蚁群聚类算法 文本聚类 参数优化 
一种改进的基于潜在语义索引的文本聚类算法被引量:3
《计算机与现代化》2014年第7期24-27,共4页侯泽民 巨筱 
郑州市科技局自然科学基金资助项目(201210439)
提出一种改进的基于潜在语义索引的文本聚类算法。算法引入潜在语义索引理论,改进传统的SOM算法。用潜在语义索引理论表示文本特征向量,挖掘文本中词与词之间隐藏的语义结构关系,从而消除词语之间的相关性,实现特征向量的降维。改进传统...
关键词:文本聚类 潜在语义索引 自组织映射 
基于GEP和CPN网络的文本聚类算法
《计算机工程与设计》2011年第11期3873-3876,共4页罗锦光 元昌安 郭乙江 邹鹏 
国家自然科学基金项目(60763012);广西新世纪十百千人才工程专项基金项目(RC2007022);广西高等学校优秀人才计划基金项目(RC2007022);广西研究生教育创新计划基金项目(2010106030774M02)
针对传统的方法很难做到根据输入向量的实际分布来设置Kohonen层各神经元对应的权向量的状况,因其会影响文本的聚类质量,所以利用人工神经网络和基因表达式编程(GEP)的互补优势,通过利用GEP在组合优化的方法进行对CPN网络中Kohonen层的...
关键词:文本聚类 基因表达式 对传网络 神经网络 自组织映射 
位置加权文本聚类算法被引量:6
《计算机工程与科学》2011年第6期154-158,共5页金春霞 周海岩 
江苏省科技攻关项目(BE2006357)
文本聚类是自然语言处理研究中一项重要研究课题,文本聚类技术广泛地应用于信息检索、Web挖掘和数字图书馆等领域。本文针对特征词在文档中的不同位置对文档的贡献大小不同,提出了基于特征词的位置加权文本聚类改进算法——TCABPW。通...
关键词:文本聚类 文本向量 特征选择 位置加权 簇间相似度 
基于最优适值保留的蚁群文本聚类算法被引量:2
《计算机工程与科学》2010年第5期79-81,共3页刘晓勇 
广东省高校优秀青年创新人才培育基金资助项目(LYM08074);广东技术师范学院自然科学基金资助项目(08kjy02)
蚁群聚类最早是由Deneubourg提出的一种仿生聚类方法,在聚类分析中得到广泛应用。本文在该算法的基础上提出一种基于精英适值保留的蚁群聚类算法,在一般蚁群聚类算法中引入精英保留机制,在每次算法的迭代中保留一定数量的优良解进入到...
关键词:文本聚类 蚁群算法 蚁群聚类 文本挖掘 
一种改进的人工免疫文本聚类算法被引量:5
《系统仿真学报》2010年第1期29-32,共4页童健华 谭洪舟 郭雷勇 
国家自然科学基金(60575006)
构造了一种能准确描述文本之间相似性(亲和力)的新方法,并在此基础上提出了一种改进的人工免疫文本聚类算法。仿真结果表明,与传统的文本聚类算法相比,新算法不仅能自动发现新类,而且具有聚类精度更高、数据压缩比更大、与输入初始配置...
关键词:抗体 亲和力计算 人工免疫网络 文本聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部