检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周惠巍[1] 杨欢[1] 黄德根[1] 李瑶[1] 李丽双[1]
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024
出 处:《中文信息学报》2013年第5期137-143,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(61272375;61173100;61173101)
摘 要:模糊限制信息检测用于区分模糊限制信息与事实信息,提高抽取信息的真实性和可靠性。模糊限制信息范围的界定具有依赖于语义和句法结构的特点,是模糊限制信息检测的一个难点。该文提出一种基于句法结构约束的模糊限制信息范围检测方法,基于依存结构树和短语结构树构建决策树,获取句法结构约束集,用于产生句法结构约束特征,并加入到条件随机域模型中进行模糊限制信息范围检测。实验采用CoNLL-2010共享任务数据集,在标准的模糊限制语标注语料上,获得了70.28%的F值,比采用普通的句法结构特征提高了4.22%。Hedge scope detection is used to distinguish factual information and uncertain information,which could improve the authenticity and reliability in information extraction.Hedge scope detection is a difficult task because of its dependency of the semantic and syntactic structures.In this paper,we propose a hedge scope detection method based on syntactic structural constraints.First,two decision trees are constructed on dependency structure and phrase structure respectively to build the syntactic constraint set.And then the hedge scope detection results based on the syntactic constraint set are used as the syntactic constraint features for Conditional Random Fields(CRF)models.Experiments on the CoNLL-2010corpus achieve the 70.28% F-score on the golden standard hedge cues,which is 4.22% higher than the system with the common syntactic construction features.
关 键 词:模糊限制信息范围检测 句法结构约束 决策树 条件随机域
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.198