检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京理工大学信息科学技术学院计算机科学工程系 [2]北京理工大学人文社会科学学院,北京100081
出 处:《北京理工大学学报》2005年第10期880-884,共5页Transactions of Beijing Institute of Technology
基 金:云南省信息技术基金资助项目(2002IT03)
摘 要:针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进.In connection with the characteristics of Chinese question answering systems, a method of query expansion is proposed. It is based on the related words for specific question types that are retrieved by pairing statistically the question-answering classes. A method of similarity between question and answering documents based on minimal matching span is implemented. The term frequency and position of information of query and query expansion in the document are fully considered in the computation. The experimental results show that in answering document retrieval of Chinese question answering system, the performance of expanding the query based on related words for specific question types is much better than in unexpanded query.
关 键 词:汉语问答系统 查询扩展 问题类别 类别关联词 答案文本检索 最小匹配距离
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.189.186.244