文本聚类

作品数:1001被引量:4944H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章徐森章成志秦永彬王正欧更多>>
相关机构:北京邮电大学贵州大学哈尔滨工业大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-10
视图:
排序:
关键语义信息补足的深度文本聚类算法被引量:1
《计算机应用研究》2023年第6期1653-1659,共7页郑璐依 黄瑞章 任丽娜 白瑞娜 林川 
国家自然科学基金资助项目(62066007)。
针对大多数现有的深度文本聚类方法在特征映射过程中过于依赖原始数据质量以及关键语义信息丢失的问题,提出了一种基于关键语义信息补足的深度文本聚类算法(DCKSC)。该算法首先通过提取关键词数据对原始文本数据进行数据增强;其次,设计...
关键词:深度文本聚类 表征学习 自动编码器 自监督聚类 数据增强 
基于多层子空间语义融合的深度文本聚类被引量:4
《计算机应用研究》2023年第1期70-74,79,共6页任丽娜 秦永彬 黄瑞章 姚茂宣 
国家自然科学基金通用联合基金重点资助项目(U1836205);国家自然科学基金资助项目(62066007,62066008);贵州轻工职业技术学院院级课题资助项目(21QY07)。
针对传统深度文本聚类方法仅利用中间层的文本语义表示进行聚类,没有考虑到不同层次的神经网络学习到的不同文本语义表示以及中间层低维表示的特征稠密难以有效区分类簇的问题,提出一种基于多层次子空间语义融合的深度文本聚类(deep doc...
关键词:文本聚类 深度聚类 自编码器 语义表示 
面向微博热点事件的话题检测及表述方法研究被引量:15
《计算机应用研究》2019年第12期3565-3569,3578,共6页周炜翔 张仰森 张良 
国家自然科学基金资助项目(61772081)
针对微博文本数据稀疏导致热点话题难以检测的问题,提出了一种基于IDLDA-ITextRank的话题检测模型。首先,通过引入微博时间序列特征和词频特征,构建了IDLDA话题文本聚类模型,利用该模型将同一话题的文本聚到一个文本集合TS;然后,通过采...
关键词:文本聚类 IDLDA-ITextRank模型 话题抽取 话题表述 
基于文本聚类与兴趣衰减的微博用户兴趣挖掘方法被引量:15
《计算机应用研究》2019年第5期1469-1473,共5页秦永彬 孙玉洁 魏笑 
国家自然科学基金重大研究计划项目(91746116);贵州省科技重大专项计划项目(黔科合重大专项字[2017]3002)
结合用户兴趣与微博信息的特点,提出了一种文本聚类与兴趣衰减的微博用户兴趣挖掘(TCID-MUIM)方法。首先通过基于词林的同义词合并策略弥补建模时词频信息不足的弊端;然后利用二次single-pass不完全聚类算法将用户微博划分为多个簇,将...
关键词:微博 single-pass聚类 LDA模型 用户兴趣挖掘 兴趣衰减 
具有词判别力学习能力的短文本聚类概率模型研究被引量:3
《计算机应用研究》2018年第12期3569-3574,共6页牛亚男 
国家自然科学基金资助项目(61473030)
社交媒体的广泛使用使短文本聚类成为一个重要的研究课题。为了解决由于短文本词向量的高维、稀疏性而造成的传统文本聚类方法应用在在短文本上效果欠佳的问题,通过大量的研究调查发现由于短文本词向量的稀疏性,词对簇结构的判别能力对...
关键词:短文本聚类 概率模型 判别力 
基于优化密度的耦合空间LDA文本聚类算法研究被引量:8
《计算机应用研究》2017年第7期1966-1970,共5页邢长征 赵全颖 王伟 王星 
国家自然科学基金资助项目(61402212);辽宁省高等学校杰出青年学者成长计划资助项目(LJQ2015045);辽宁省自然科学基金资助项目(2015020098);辽宁省教育厅城市研究院一般项目(LJCL008)
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文...
关键词:文本聚类 耦合空间模型 LDA主题模型 密度 阈值 
基于增强蜂群优化与K-means的文本聚类算法被引量:8
《计算机应用研究》2016年第8期2298-2302,共5页柯钢 
国家自然科学基金资助项目(61106019);东莞市社会科技发展项目(2013108101045)
针对文本数据维度较高、空间分布稀疏及其聚类效果不佳的问题,提出一种基于增强蜂群优化搜索与K-means的高效文本聚类算法。首先为蜂群算法引入公平操作与克隆操作来提高全局搜索的能力,公平操作提高了样本多样性,并增强了蜂群搜索能力...
关键词:蜂群算法 公平操作 克隆操作 多样性 局部提炼 文本聚类 
基于相对密度的多耦合文本聚类算法被引量:2
《计算机应用研究》2016年第6期1624-1627,共4页王洪佳 邢长征 王星 
国家自然科学基金资助项目(61402212)
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基于相对密度的聚类方法基础上,该算法根据相对密度越小文本相似性越小这一事实,将相对密度转换为文本相似度...
关键词:文本聚类 空间向量模型 相对密度 文本相似度 核心对象 
基于混合行为兴趣度的用户兴趣模型被引量:19
《计算机应用研究》2016年第3期661-664,668,共5页邢玲 宋章浩 马强 
国家自然科学基金资助项目(61171109);四川省科技厅应用基础项目(2014JY0215);四川省重点实验室开放基金项目(13zxtk07)
用户兴趣模型是个性化推荐技术的基础与核心,针对现有用户兴趣模型在模型建立阶段用户兴趣评价的不足,提出了一种基于混合行为评价兴趣度值的方法。突出了用户阅读时间的特殊性,在用户阅读时间异常的情况下利用其他浏览行为来量化用户...
关键词:用户兴趣模型 用户兴趣度 向量空间模型 文本聚类 推荐系统 
基于语义空间的藏文微博情感分析方法被引量:11
《计算机应用研究》2016年第3期682-685,共4页袁斌 江涛 于洪志 
国家自然科学基金资助项目(61262054);甘肃省科技重大专项资助项目(1203FKDA033);西北民族大学中央专项资金资助研究生项目(Yxm2014001);国家科技支撑计划资助项目(2014BAK10B03)
藏文微博具有独特的语法特点,传统方法对藏文文本进行情感分类很难取得较好效果。结合藏文句法结构和语义特征向量构建语义特征空间,提出了一种基于语义空间的藏文微博情感分析方法。首先使用句法树生成句法结构并结合语义特征向量构建...
关键词:藏语微博 情感分类 语义空间 文本聚类 语义簇 
检索报告 对象比较 聚类工具 使用帮助 返回顶部