检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:尹兆良 黄于欣 余正涛[1,2] 王冠文 艾传鲜 YIN Zhaoliang;HUANG Yuxin;YU Zhengtao;WANG Guanwen;AI Chtuanxian(Faculty of lnformation Enginering and Automation,Kunming University of Science and Tehmology,Kunming 650500,Yunnan,China;Key Laboratory of Artificial Intelligence in Yunnan Province,Kunming University of Science and Technology,Kunming 650500,Yunnan,China;Yunnan Branch of the National Computer Network Emergency ResponseTechnical Team/Coordination Center of China,Kunming 650500,Yunnan,China)
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650500 [2]昆明理工大学云南省人工智能重点实验室,云南昆明650500 [3]国家计算机网络应急技术处理协调中心云南分中心,云南昆明650500
出 处:《计算机工程》2025年第4期208-216,共9页Computer Engineering
基 金:国家自然科学基金(U21B2027,61972186,62266027,62266028);云南省重大科技专项(202302AD080003,202202AD080003);云南省基础研究项目(202301AT070393,202301AT070471)。
摘 要:介绍涉案新闻主题分析的应用场景以及现有方法的不足之处。针对这些不足,提出一种融合罪名分类的主题分析模型BERT-ECTM。该模型利用法律文书中的罪名信息作为监督信号,与涉案新闻文本相融合作为主题分析模型的输入,以提高涉案新闻主题信息的准确性和涉案偏好。为了捕捉上下文语义特征,采用基于BERT编码的嵌入式主题分析方法,以提高主题分析的准确性和效果。此外,在模型训练时,针对边际分布求解难度较大、复杂程度高这一问题,结合变分推断的方法,用后验分布的近似分布来拟合其分布结果。实验结果表明,在特定的涉案新闻主题分析任务中,该模型的有效性和准确性相比于现有方法均有明显提升。This paper discusses the significance of crime news topic analysis and identifies the limitations of existing methods.The paper presents a novel topic analysis model called the Bidirectional Encoder Representations from Transformers-based Embedded Crime Topic Model(BERT-ECTM)to address identified issues.The model leverages crime charges from legal documents as supervision signals and combines them with crime news text as input to enhance the accuracy and crime preferences of crime news topic information.The model adopts a BERT-based embedded topic analysis approach to capture contextual semantic features effectively.This paper also introduces a variation inference method that approximates the posterior distribution for improved distribution results,to address the challenge of complex marginal distribution estimation during model training.The proposed model is significantly more effective and accurate than traditional methods in analyzing specific crime news topics.
关 键 词:文本主题抽取 罪名分类 BERT-ECTM模型 涉案偏好 文本语义 语义特征编码 变分推断
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7