基于业务过程模型的刑事案件裁判文书过程信息自动梳理技术  

Method for automatic extracting process models from criminal case records with business process model

在线阅读下载全文

作  者:张源[1] 邹文涛 袁豪 李传艺[1] 葛季栋[1] 骆斌[1] ZHANG Yuan;ZOU Wentao;YUAN Hao;LI Chuanyi;GE Jidong;LUO Bin(State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210046,China)

机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210046

出  处:《计算机集成制造系统》2024年第8期2968-2980,共13页Computer Integrated Manufacturing Systems

基  金:国家自然科学基金资助项目(61802167)。

摘  要:在信息时代,大量过程信息被隐藏在由自然语言写成的文档中,从中自动抽取过程模型并可视化将有助于对过程信息的查看和管理。在中国刑事案件裁判文书中,存在着以下两个挑战:①事件在文本中的描述未严格按照时间顺序;②存在大量噪声信息。尽管该特征广泛存在于不同领域的文本中,相关的研究却很少。为此,提出一种具有可移植性的文本过程挖掘算法,通过结合领域知识和机器学习建立名为“事件框架”的新型数据结构,从而解决上述难点并最终自动构建业务过程模型。通过人工构建的大量过程模型与自动生成的过程模型在结构、文本相似度上的实验对比,证明该算法能有效地解决上述挑战。Nowadays,a large amount of process information is hidden in natural language documents.Extracting process models from documents would provide clear and concise views of them.There exists lots of related research in different application domains.While handling the Chinese Judgement Document,where the process of handling a legal case is recorded,we found that challenges features:①the events do not strictly follow chronological order;②a mass of noisy information exists.Although these features are widely found in texts in a variety of fields,little work is done to deal with them.A portable approach for mining process models was proposed from texts with these features.Through prior domain knowledge and machine learning,a novel data entity named event framework was constructed to solve above difficulties and generate business process models automatically.Experimental results showed that the proposed approach could effectively handle the above-mentioned challenges.

关 键 词:过程挖掘 过程文本 自然语言处理 事件抽取 裁判文书 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象