检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王浩成 贺瑞芳[1,2] 吴辰昊 刘焕宇 WANG Hao-Cheng;HE Rui-Fang;WU Chen-Hao;LIU Huan-Yu(College of Intelligence and Computing,Tianjin University,Tianjin 300350,China;Tianjin Key Laboratory of Cognitive Computing and Applications(Tianjin University),Tianjin 300350,China)
机构地区:[1]天津大学智能与计算学部,天津300350 [2]天津市认知计算与应用重点实验室(天津大学),天津300350
出 处:《软件学报》2024年第11期5133-5148,共16页Journal of Software
基 金:国家自然科学基金(61976154);国家重点研发计划(2019YFC1521200)。
摘 要:检测社交媒体文本中的潜在主题是一项有意义的任务.由于帖子具有表达简短、非正规的特点,其将带来严重的数据稀疏问题.不仅如此,基于变分自编码器(variational auto-encoder,VAE)的模型在主题推断过程中还忽视了用户间的社交关系,考虑VAE假设输入的数据点间是相互独立的.这导致了推断的潜在主题变量间缺少了相关性信息,进而导致主题不够连贯.社交网络结构信息不仅聚合上下文信息的线索,还暗示了用户间的主题相关性.因此,提出基于消息传递和图先验分布的微博主题模型,其借助图卷积网络(graph convolution network,GCN)编码更加丰富的上下文信息,并且在变分自编码器推断主题的过程中,通过图先验分布整合用户交互关系以促进对多数据点复杂关系的理解,从而更好地挖掘社交媒体主题信息.在3个真实微博数据集上的实验证明了所提方法的有效性.Detecting latent topics in social media texts is a meaningful task,and the short and informal posts will cause serious data sparsity.Additionally,models based on variational auto-encoders(VAEs)ignore the social relationships among users during topic inference and VAE assumes that each input data point is independent.This results in the lack of correlation information between the inferred latent topic variables and incoherent topics.Social network structure information can not only provide clues for aggregating contextual messages but also indicate topic correlation among users.Therefore,this study proposes to utilize the microblog topic model based on message passing and graph prior distribution.This model can encode richer context information by graph convolution network(GCN)and integrate the interactive relationship of users by graph prior distribution during VAE topic inference to better understand the complex correlation among multiple data points and mine social media topic information.The experiments on three actual datasets validate the effectiveness of the proposed model.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.79