主题模型

作品数:1251被引量:5915H指数:32
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛刘业政李斌徐华严建峰更多>>
相关机构:北京邮电大学武汉大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-10
视图:
排序:
监督式主题模型及其应用综述
《计算机工程与应用》2024年第8期56-68,共13页王振彪 徐贞顺 刘纳 张文豪 唐增金 王正安 
宁夏自然科学基金(2021AAC03217,2021AAC03224)。
主题模型是一种数据挖掘的方法,可以自动地从大量文件或数据中提取潜在的模式或主题,并将对应的数据分配到相应的模式或主题中。主题模型已广泛应用于文本聚类或分类、主题抽取、主题演变、情感分析和摘要总结等领域。监督式主题模型和...
关键词:数据挖掘 监督式主题模型 主题预测 主题演变 
面向短文本的增强上下文神经主题模型
《计算机工程与应用》2024年第1期154-164,共11页刘刚 王同礼 唐宏伟 战凯 杨雯莉 
黑龙江省高等教育教学改革研究项目(SJGZ20200044);黑龙江省自然科学基金(LH2021F015);国家高端外国专家引进计划项目(G2021180008L)。
目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主...
关键词:神经主题模型 短文本 稀疏约束 变分自编码器 主题建模 
面向短文本语义分析的标签条件神经主题模型
《计算机工程与应用》2023年第11期80-87,共8页王嫄 鄢艳玲 徐茂玲 胡鹏 赵婷婷 杨巨成 
国家自然科学基金(61702367,61976156);天津市企业科技特派员项目(20YDTPJC00560);天津市自然科学基金(19JCYBJC15300)。
无监督机器学习方法中的神经主题模型已被广泛用于自动挖掘文本潜在语义。然而,短文本篇幅有限,文中可用于推断的信息匮乏,模型难以在上下文不充分的情况下正确识别歧义词。为此,提出了一种面向短文本语义分析的标签条件神经主题模型,...
关键词:神经主题模型 短文本 泰勒损失 
基于BERT的嵌入式文本主题模型研究被引量:8
《计算机工程与应用》2023年第1期169-179,共11页王宇晗 林民 李艳玲 赵佳鹏 
国家自然科学基金(61806103,61562068);内蒙古自然科学基金(2017MS0607);内蒙古自治区科技计划项目(JH20180175);信息安全242课题(2019A114)。
主题模型能够从海量文本数据中挖掘语义丰富的主题词,在文本分析的相关任务中发挥着重要作用。传统LDA主题模型在使用词袋模型表示文本时,无法建模词语之间的语义和序列关系,并且忽略了停用词与低频词。嵌入式主题模型(ETM)虽然使用Word...
关键词:主题模型 BERT模型 词嵌入 词向量可视化 
基于在线Biterm主题模型的舆情新闻事件跟踪
《计算机工程与应用》2022年第22期132-141,共10页马子娟 岳昆 段亮 赵天资 
国家自然科学基金云南联合基金重点支持项目(U1802271);国家自然科学基金(62002311);云南省基础研究计划杰出青年项目(2019FJ011);云南省重大科技专项计划(202002AD080002);中国博士后面上项目(2020M673310);云南省万人计划“青年拔尖人才”计划;云南大学“东陆学者”培育计划。
舆情新闻事件跟踪,是舆情监控、热点分析、政策制定等研究和应用的重要基础。针对舆情新闻的稀疏性、敏感性、易演化性、次生性等特点,基于在线Biterm主题模型(online Biterm topic model,DBTM),通过随机坍缩变分贝叶斯(stochastic coll...
关键词:舆情新闻事件 事件跟踪 事件线索 在线Biterm主题模型 
主题感知的长文本自动摘要算法被引量:1
《计算机工程与应用》2022年第20期165-173,共9页杨涛 解庆 刘永坚 刘平峰 
湖北省自然科学基金(2018CFB564);中央高校基本科研业务经费(WUT:2020III008GX)。
长文本摘要生成一直是自动摘要领域的难题。现有方法在处理长文本的过程中,存在准确率低、冗余等问题。鉴于主题模型在多文档摘要中的突出表现,将其引入到长文本摘要任务中。另外,目前单一的抽取式或生成式方法都无法应对长文本的复杂...
关键词:主题模型 长文本摘要 混合模型 指针网络 
改进在线词对主题模型的微博热点话题演化被引量:3
《计算机工程与应用》2021年第24期179-184,共6页吴迪 张梦甜 生龙 黄竹韵 顾明星 
国家重点研发计划“科技冬奥”重点专项子课题(2018YFF0301004-02);河北省自然科学基金(F2020402003,F2019402428);河北省高等学校科学技术研究重点项目(ZD2018087)。
话题演化分析是舆情监控的研究热点之一,面向微博热点话题进行演化分析,对于网络用户以及网络监管部门都有很重要的现实意义。针对在线词对主题模型(On-line Biterm Topic Model,OBTM)新旧主题混合、冗余词概率相对较高的问题,对OBTM进...
关键词:话题标签 先验参数 主题强度排名 在线词对主题模型 微博热点话题演化 
基于主题和关键词特征的比较文本分类方法被引量:4
《计算机工程与应用》2021年第17期196-202,共7页丁勇 程家桥 蒋翠清 王钊 
国家自然科学基金重点项目(71731005);教育部人文社会科学规划基金项目(15YJA630010)。
比较文本对于企业竞争产品分析至关重要,但目前面向问答领域的比较文本分类研究较少。针对问答文本中比较信息丰富、主题集中的特点,提出了基于主题特征和关键词特征扩展的比较文本分类方法。通过预训练主题模型,推断问答文本的主题概...
关键词:主题模型 自编码器 特征扩展 比较文本分类 
融合SLDA主题模型的不均衡文本分类方法被引量:3
《计算机工程与应用》2021年第12期144-154,共11页唐焕玲 刘艳红 郑涵 窦全胜 鲁明羽 
国家自然科学基金(61976124,61976125,61772319,61773244,61972235)。
在标签均衡分布且标注样本足够多的数据集上,监督式分类算法通常可以取得比较好的分类效果。然而,在实际应用中样本的标签分布通常是不均衡的,分类算法的分类性能就变得比较差。为此,结合SLDA(Supervised LDA)有监督主题模型,提出一种...
关键词:有监督主题模型 半监督学习 不均衡文本 分类 
基于BTM图卷积网络的短文本分类方法被引量:5
《计算机工程与应用》2021年第4期155-160,共6页郑诚 董春阳 黄夏炎 
由于短文本长度较短,在分类时会面临数据稀疏和语义模糊等问题。提出新型图卷积网络BTM_GCN,该网络利用双项主题模型(Biterm Topic Model,BTM)在短文本数据集上训练出固定数量的文档级潜在主题,并作为一种节点嵌入到文本异构图中,再与...
关键词:短文本分类 图卷积网络 BTM主题模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部