检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄鑫[1,2] 朱巧明[2] 钱龙华[2] 刘梅梅[1,2]
机构地区:[1]江苏省计算机信息处理技术重点实验室,江苏苏州215006 [2]苏州大学计算机科学与技术学院,江苏苏州215006
出 处:《微电子学与计算机》2010年第4期198-200,204,共4页Microelectronics & Computer
基 金:国家"八六三"计划项目(2006AA01Z147);江苏省自然科学基金(60673041)
摘 要:结合中文关系抽取的要求,以ACE2005的中文语料为数据进行关系抽取实验.在抽取中文词法、实体、句法,语法基本特征后,提出采用特征组合方法,使用支持向量机的机器学习(SVM)方法,在上关系探测和关系大类上F值分别提高了1.36%和3.97%,达到72.77和61.03,并分析出各部分组合特征的贡献.实验数据表明词语和实体组合特征对中文关系抽取的作用较大.This paper carried out a series of experiments on Chinese relation extraction classification based on standard and training corpus of ACE2005 (Automatic Content Extraction 2005). It explores word, entity, syntax, gram features in Chinese at first, and then present a method which combines these basic features. The F-score of Chinese relation extraction for Relation Detection and six major types in ACE2005 Chinese corpora improves 1.36% and 3.97% and achieves 72.77 and 61.03 respectively in SVM, then give the contribution of different combined features. It illustrates that the combined features of words and entities are very effective for Chinese Relation Extraction.
关 键 词:中文关系抽取 信息抽取 ACE2005 支持向量机 特征组合
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249