裁判文书类案推送中的案情相似度计算模型研究  被引量:18

A case similarity calculation model in case pushing of judicial documents

在线阅读下载全文

作  者:王君泽[1,2] 马洪晶 张毅[1,2] 杨兰蓉[1,2] WANG Jun-ze;MA Hong-jing;ZHANG Yi;YANG Lan-rong(College of Public Administration,Huazhong University of Science and Technology,Wuhan 430074;Non-traditional Security Center,Huazhong University of Science and Technology,Wuhan 430074,China)

机构地区:[1]华中科技大学公共管理学院,湖北武汉430074 [2]华中科技大学非传统安全研究中心,湖北武汉430074

出  处:《计算机工程与科学》2019年第12期2193-2201,共9页Computer Engineering & Science

基  金:国家自然科学基金(61602198)

摘  要:裁判文书的类案推送策略有助于解决司法过程中的裁判尺度不统一、类案不同判、量刑不规范等问题。针对裁判文书类案推送任务,基于裁判文书在篇章结构和语言表述方面的特征,从裁判文书案情内容的抽取、案情内容中不同词性类别词项的权重分析、案情内容中未登录词的识别、案情内容中数量表述的相似度计算等角度展开研究,并设计相应的案情相似度计算模型。通过在真实裁判文书数据集合上的实验,表明了该模型的有效性。The strategy of pushing similar cases of judicial documents is helpful to solve problems such as the disunity of judgment standard,the difference of judgment with similar cases and the irregularity of sentencing in the judicial process.Aiming at the similar cases pushing strategy of judicial documents,based on the written discourse structure and linguistic expression of judicial documents,we can carry out the research by extracting the contents of judicial documents,analyzing the weights of different speech words,recognizing the unknown Chinese words in the contents,and calculating the quantity expression similarity.Besides,we design the corresponding case similarity calculation model.Experiments on real judicial documents datasets prove the validity of the model.

关 键 词:类案推送 词性权重 未登录词识别 文本相似度 

分 类 号:TP391.7[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象