基于句法分析和答案分类的中文问答系统  被引量:14

Chinese Question Answering Based on Syntax Analysis and Answer Classification

在线阅读下载全文

作  者:孙昂[1] 江铭虎[1] 贺一帆[1] 陈林[1] 袁保宗[2] 

机构地区:[1]清华大学人文学院计算语言学实验室,北京100084 [2]北京交通大学信息科学研究所,北京100044

出  处:《电子学报》2008年第5期833-839,共7页Acta Electronica Sinica

基  金:国家自然科学基金(No.60673109)

摘  要:本文根据疑问词和谓语的距离信息对问句进行细致的句型分析,然后对答句进行浅层句法分析,在此基础上,抽取出问题特征集、答句特征集和组合特征集作为分类特征,引入最大熵模型和支持向量机训练答案抽取分类器.基于不同特征组合训练得到的分类器在五类事实性问题上进行了测试,其F值分别达到70.87%和85.75%.This paper first conduets rigorous sentence pattern analysis of questions based on the distance between question word and predicate,and then conduct shallow parse of answer candidate sentences.Based on the analysis, we extract question feature set;answer sentence feature set and combined feature set as our features for answer classification. Then we apply maximum entropy model and support vector machine to these features to train answer classifiers. The F-Measures of the two classifiers' experiment conducted on five kinds of fact-based questions achieve 70.87 % and 85.75 % respectively.

关 键 词:中文问答系统 句法分析 答案抽取 最大熵模型 支持向量机 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象