主题模型

作品数:1268被引量:5967H指数:32
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛刘业政李斌徐华严建峰更多>>
相关机构:北京邮电大学武汉大学南京大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-10
视图:
排序:
融入类别标签和主题信息的用户兴趣识别方法被引量:1
《计算机科学》2024年第S01期661-668,共8页康智勇 李弼程 林煌 
装备预研教育部联合基金(8091B022150)。
社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义。目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的...
关键词:社交网络 兴趣识别 主题模型 标签注意力机制 特征融合 
一种结合代码片段和混合主题模型的软件数据聚类方法
《计算机科学》2024年第6期44-51,共8页魏林林 沈国华 黄志球 蔡梦男 郭菲菲 
国家自然科学基金(61772270,U2241216);民航应急科学与技术重点实验室开放基金(NJ2022022)。
使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主...
关键词:代码片段 主题模型 Stack Overflow PYTHON 聚类 
基于情感-主题-讽刺混合模型的讽刺检测研究被引量:1
《计算机科学》2023年第S01期131-136,共6页付月 史伟 
国家社会科学基金一般项目(20BXW013)。
讽刺检测是观点挖掘的一个子任务,主要目的是识别用户在书面文本中表达的观点或情感。文本中讽刺句往往具有混合的情感极性,正确识别讽刺句和非讽刺句在情感分析中起着至关重要的作用。讽刺检测方法一般都采用机器学习分类器,其中分类...
关键词:讽刺 情感分析 观点挖掘 主题模型 
融入全局信息的抽取式摘要研究被引量:2
《计算机科学》2023年第4期188-195,共8页张翔 毛兴静 赵容梅 琚生根 
国家自然科学基金重点项目(62137001)。
抽取式自动文本摘要旨在从原文中抽取最能表示全文语义的句子组成摘要,由于具有简单高效的特点被广泛地应用和研究。目前,抽取式摘要模型大多基于句子间的局部关系得到重要性得分,从而选择句子,这种方式忽略了原文的全局语义信息,模型...
关键词:抽取式文本摘要 全局信息 方面抽取 神经主题模型 
突发事件中网络评论的情感-主题随时间的演变研究
《计算机科学》2022年第S02期195-200,共6页史伟 付月 
国家社会科学基金一般项目(20BXW013)
网络评论的情感主题演变分析对突发事件中网络舆情的控制极具价值。针对情感主题动态性的特点,构建一个基于LDA的情感主题模型,通过对时间与主题和情感的联合建模来分析情感主题随时间的演变,推导了基于Gibbs抽样过程的推理算法,最后通...
关键词:时间感知情感主题模型 时间序列 趋势分析 情感分析 
基于次模函数最大化的测试用例集约简被引量:1
《计算机科学》2021年第12期75-84,共10页文进 张星宇 沙朝锋 刘艳君 
国家重点研发计划(2018YFB0904503)。
随着软件回归测试规模的不断增大和成本的不断增加,测试用例集约简对于提高软件的回归测试效率显得愈发重要。在选取测试用例子集时,需考虑该子集的代表性和多样性,并采用一个有效的算法来求解。针对该测试用例集约简问题,文中提出了一...
关键词:软件测试 测试用例集约简 错误检测 主题模型 次模函数 
融合语义模型的二分网络推荐算法
《计算机科学》2020年第S02期482-485,共4页周波 
当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合...
关键词:语义模型 作者主题模型 二分网络 推荐算法 
基于主题模型的Ubuntu操作系统缺陷报告的分类及分析被引量:2
《计算机科学》2020年第12期35-41,共7页周凯 任怡 汪哲 管剑波 张芳 赵言亢 
国家自然科学基金(61872444);国家核高基重大专项(2017ZX01038104-002)。
软件缺陷(Bug)是造成系统失效的主要原因之一,为了更好地开发软件与修复软件失效,需要对缺陷的分布等特征有更好的理解。Ubuntu是一款得到广泛应用的开源软件,也是Linux操作系统当前在全球最成功的发行版之一。利用缺陷报告来发掘软件...
关键词:Ubuntu操作系统 LDA模型 缺陷分类 缺陷报告分析 
融合文本与分类信息的重复缺陷报告检测方法被引量:9
《计算机科学》2019年第12期192-200,共9页范道远 孙吉红 王炜 涂吉屏 何欣 
软件缺陷是软件出现错误、故障的根源。软件缺陷是需求分析不合理、编程语言不严谨、开发人员缺少经验等因素导致的。软件缺陷不可避免,提交缺陷报告是发现缺陷并改进缺陷的重要途径。缺陷报告是描述缺陷的载体,对缺陷报告的修复是完善...
关键词:重复缺陷报告 信息检索方法 主题模型 One-Hot 相似性融合 
基于动态权重的LDA算法被引量:8
《计算机科学》2019年第8期260-265,共6页居亚亚 杨璐 严建峰 
国家自然科学基金(61572339,61272449);江苏省科技支撑计划重点项目(BE2014005)资助
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚类。该模型以词袋(Bag of Words,BOW)模型为假设,所有单词的重要性相同,简化了建模的复杂度,但使得主题...
关键词:潜在狄利克雷分布 主题模型 动态权重 
检索报告 对象比较 聚类工具 使用帮助 返回顶部