检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张源[1] 邹文涛 袁豪 李传艺[1] 葛季栋[1] 骆斌[1] ZHANG Yuan;ZOU Wentao;YUAN Hao;LI Chuanyi;GE Jidong;LUO Bin(State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210046,China)
机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210046
出 处:《计算机集成制造系统》2024年第8期2968-2980,共13页Computer Integrated Manufacturing Systems
基 金:国家自然科学基金资助项目(61802167)。
摘 要:在信息时代,大量过程信息被隐藏在由自然语言写成的文档中,从中自动抽取过程模型并可视化将有助于对过程信息的查看和管理。在中国刑事案件裁判文书中,存在着以下两个挑战:①事件在文本中的描述未严格按照时间顺序;②存在大量噪声信息。尽管该特征广泛存在于不同领域的文本中,相关的研究却很少。为此,提出一种具有可移植性的文本过程挖掘算法,通过结合领域知识和机器学习建立名为“事件框架”的新型数据结构,从而解决上述难点并最终自动构建业务过程模型。通过人工构建的大量过程模型与自动生成的过程模型在结构、文本相似度上的实验对比,证明该算法能有效地解决上述挑战。Nowadays,a large amount of process information is hidden in natural language documents.Extracting process models from documents would provide clear and concise views of them.There exists lots of related research in different application domains.While handling the Chinese Judgement Document,where the process of handling a legal case is recorded,we found that challenges features:①the events do not strictly follow chronological order;②a mass of noisy information exists.Although these features are widely found in texts in a variety of fields,little work is done to deal with them.A portable approach for mining process models was proposed from texts with these features.Through prior domain knowledge and machine learning,a novel data entity named event framework was constructed to solve above difficulties and generate business process models automatically.Experimental results showed that the proposed approach could effectively handle the above-mentioned challenges.
关 键 词:过程挖掘 过程文本 自然语言处理 事件抽取 裁判文书
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7