检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:邹俊杰[1,2] 余正涛[1,2] 刘跃红 宗焕云[1,2] 苏磊[1,2]
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650051 [2]昆明理工大学智能信息处理重点实验室,云南昆明650051
出 处:《计算机工程与设计》2012年第3期1229-1233,1250,共6页Computer Engineering and Design
基 金:国家自然科学基金项目(60863011);云南省自然科学重点基金项目(2008CC023);云南省中青年学术和技术带头人后备人才基金项目(2007PY01-11)
摘 要:针对领域知识特点和当前基本查询扩展方法的局限性,提出了在特定领域问答系统中将命名实体识别与基本查询扩展方法相结合对答案文本检索进行查询扩展的方法。该方法标注旅游领域18个类别的命名实体,并使用条件随机场理论建立实体识别模型,将识别模型以线性插值方式分别融合到本文选用的基于TF-IDF、互信息和局部上下文分析3种基本查询扩展方法中,再选取出扩展词进行查询。在旅游领域数据集上的实验结果表明,该方法在3种基本查询扩展方法基础上使准确度提高15.8%以上,其中结合领域命名实体识别和局部上下文分析的查询扩展方法的准确度提高了21.4%。For the characteristics of domain knowledge and the current limitations of the basic query expansion method, a new query expansion method of domain text retrieval by combining special named entity recognition (SNER) and basic query expan- sion method is proposed. First, eighteen categories of named entities are marked, and then the theory of conditional random fields (CRFS) is adopted to establish entity recognition model, finally, recognition model is integrated into the local context anal- ysis of query expansion method by linear interpolation method to select expansion terms. The experimental result of tourism data sets shows the proposed method is superior to the existing three basic expansion methods: the accuracy is improved by 15.8%. In particular, the method of fusion LCA and SNER improved 21.4%.
关 键 词:特定领域 查询扩展 命名实体识别 局部上下文分析 文本检索
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222