检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《中文信息学报》2007年第4期80-85,91,共7页Journal of Chinese Information Processing
摘 要:命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了一些适合各自特点的新的句法特征。在CRF模型框架下,以ACE2007的语料作为实验数据,结果表明本文的划分方法和新特征有效的提高了汉语实体关系抽取任务的性能。Entity Relation Extraction is one of the important research fields in Information Extraction. This paper presents a novel method through dividing the entity relations into two categories: embedding relations and non-embedding relations. After some simple experiments, we discover that some syntactic features have explicitly different effects on the idcntification of the two kinds of relations. So two different set of syntactic features are suggested to extract the two categories. Experiments show that the new method achieves an improved performance on the ACE2007 Corpus for Chinese entity relation extraction task.
关 键 词:计算机应用 中文信息处理 实体关系抽取 包含关系 非包含关系 特征选择 ACE评测
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171