检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与设计》2009年第15期3587-3590,共4页Computer Engineering and Design
基 金:国家973重点基础研究发展计划基金项目(2007CB613507)
摘 要:针对基于特征向量的实体关系抽取方法中特征向量一般构造方法存在的不足,提出了基于互信息的实体对特征向量构造方法。该方法引入词和实体关系类别之间的互信息作为一个句子中实体对左右两边上下文特征提取的判断标准,并对实体关系类别特征词条进行编码,在此基础上再对实体对左右两边的上下文信息进行编码。这样做压缩了实体对上下文信息编码的维数,突出了实体关系各类别特性。实验结果表明本文的实体关系特征向量构造方法提高了中文实体关系抽取的准确率和召回率。Toovercomethedefectsoffeaturevectortraditionalconstruction, a method offeature vector construction is brought forward, which is based on mutual information. The method introduces mutual information between word and entity relation type as a standard to extract the feature of entity pair context in a sentence and codes the feature word of entity relation type, then codes the context of entity pair. The method not only compress the dimensions of the context coding, but also highlights the character of entity relation types. Ex- periments show that the method improves the precision and recall of Chinese entity relation task.
关 键 词:信息抽取 实体关系抽取 特征向量 互信息 支持向量机
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171