检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李方涛[1] 张显[1] 孙建树[1] 朱小燕[1]
机构地区:[1]清华大学计算机科学技术系智能技术与系统国家重点实验室,北京100084
出 处:《中文信息学报》2008年第1期93-98,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60572084);863国家高技术研究发展计划资助项目(2006AA02Z321)
摘 要:问题分类是自动问答系统中关键技术之一,而问题中的关键词语是问题分类的重要依据。本文主要探讨问题词和中心词在问题分类中所起的作用,提出一种基于问题词和中心词的层次化结构问题分类器。分类器首先利用问题词将句子集分为三类,然后对于每个类别分别建立相应的分类器,对于what型问题,本文构造了基于关联规则的中心词分类器。本文实现的层次化结构分类器在TREC 2007 QA问题集和UIUC数据集上精度分别达到了90.6%和84.0%,充分显示了问题词和中心词在问题分类中至关重要的作用。Question classification is one of the most crucial models in question answering system. And the key words play very important roles for question classification task. In this paper, we investigate the role of question word and head word in question classification. This paper proposed a novel hierarchical structure question classifier based on the question words and head words. Using question words, it first simple classified the question sentence into three categories. For each category, we designed an appropriate classifier respectively. As to the type of what questions, we constructed a head word based classifier using assassination rules. The novel hierarchical structure question clas- sifier is tested on the TREC2007 QA question set and the UIUC Dataset. It can get accuracy of 90.60/00, 84.0% respectively, which proved the importance of the question words and head words in the question classification.
关 键 词:计算机应用 中文信息处理 问题分类 自动问答系统 问题词 中心词
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.158