面向事件的中文指代语料库的构建  被引量:4

Construction of event-oriented Chinese coreference corpus

在线阅读下载全文

作  者:张亚军[1,2] 刘宗田 李强[1] 周文[1] ZHANG Yajun;LIU Zongtian;LI Qiang;ZHOU Wen(School of Computer Engineering and Science, Shanghai University, Shanghai 200444, China;Shanghai Precision Metrology and Test Research Institute, Shanghai 201109, China)

机构地区:[1]上海大学计算机工程与科学学院,上海200444 [2]上海精密计量测试研究所,上海201109

出  处:《上海大学学报(自然科学版)》2018年第6期900-911,共12页Journal of Shanghai University:Natural Science Edition

基  金:国家自然科学基金资助项目(61273328;61305053;71203135)

摘  要:指代消解是自然语言处理中的关键和热点问题之一,而语料库的研究是指代消解研究中的基础性工作.在中文突发事件语料库(Chinese emergency corpus, CEC)的基础上,通过自动生成和人工标注的方法,构造一个面向事件的中文指代语料库.与传统指代语料库不同,该语料库针对的是以事件作为知识表示单元的文本,对事件中各要素和事件的指代进行标注,其构建对面向事件的中文指代消解的研究十分关键,提供了更多的资源支持.同时,对CEC中各事件要素和事件的指代进行了统计和分析,为今后的工作提供了一些铺垫.Coreference resolution,a key in natural language processing,is a basic reasearch topic.This paper describes how an event-oriented Chinese coreference corpus is built based on the Chinese emergency corpus(CEC)via automatic generation and manual annotation.Differing from the traditional coreference corpuses,this corpus is directed to the text,in which knowledge representation unit is based on events,and coreference of elements and events are annotated.The construction of corpus is a key to the research of event-oriented Chinese coreference resolution,which provides more resources to support.The coreference of elements and events are counted and analyzed to provide a basis for the future research.

关 键 词:中文 事件 指代 语料库 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象