检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南文理学院计算机科学与技术学院,湖南常德415000 [2]湖南城市学院,湖南益阳413000
出 处:《计算机工程》2010年第24期289-290,F0003,共3页Computer Engineering
摘 要:现有命名实体关系抽取算法没有考虑关系特征序列的模式差异。针对该不足,提出一种改进的命名实体关系抽取算法。在语料库中识别出所有命名实体,利用最短依存路径以及与实体本身关系密切的词对实体关系特征进行提取,基于核函数计算关系特征序列的相似度,输出候选命名实体关系对及其关系。实验结果表明,改进算法具有较好的查全率与查准率,其调和平均值可达78%。Existing named entity relation extraction algorithm does not consider the pattern difference of relation characteristic sequence. Aiming at this shortage, this papcr proposcs an improved entity relation extraction algorithm. It identifies all of the named entity in the corpus, extracts entity relation characteristic bascd on the shortest path dependence and the words closely related to the entities, and computes the similarity of the relation feature sequences based on kernel function. Experimental result shows that the improved algorithm has good recall and precision, and its harmonic mean is up to 78%.
关 键 词:命名实体关系抽取 最短依存路径 核函数 调和平均值
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222