检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙昂[1] 江铭虎[1] 贺一帆[1] 陈林[1] 袁保宗[2]
机构地区:[1]清华大学人文学院计算语言学实验室,北京100084 [2]北京交通大学信息科学研究所,北京100044
出 处:《电子学报》2008年第5期833-839,共7页Acta Electronica Sinica
基 金:国家自然科学基金(No.60673109)
摘 要:本文根据疑问词和谓语的距离信息对问句进行细致的句型分析,然后对答句进行浅层句法分析,在此基础上,抽取出问题特征集、答句特征集和组合特征集作为分类特征,引入最大熵模型和支持向量机训练答案抽取分类器.基于不同特征组合训练得到的分类器在五类事实性问题上进行了测试,其F值分别达到70.87%和85.75%.This paper first conduets rigorous sentence pattern analysis of questions based on the distance between question word and predicate,and then conduct shallow parse of answer candidate sentences.Based on the analysis, we extract question feature set;answer sentence feature set and combined feature set as our features for answer classification. Then we apply maximum entropy model and support vector machine to these features to train answer classifiers. The F-Measures of the two classifiers' experiment conducted on five kinds of fact-based questions achieve 70.87 % and 85.75 % respectively.
关 键 词:中文问答系统 句法分析 答案抽取 最大熵模型 支持向量机
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222