基于浅层句法分析和最大熵的问句语义分析  被引量:2

Semantic Analysis of Question Based on Shallow Parsing and Maximum Entropy

在线阅读下载全文

作  者:李冬梅[1] 张琪[1] 王璇[2] 檀稳 LI Dongmei;ZHANG Qi;WANG Xuan;TANWen(School of Information Science and Technology, Beijing Forestry University, Beijing 100083, China;School of Information, Renmin University of China, Beijing 100872, China)

机构地区:[1]北京林业大学信息学院 [2]中国人民大学信息学院

出  处:《计算机科学与探索》2017年第8期1288-1295,共8页Journal of Frontiers of Computer Science and Technology

基  金:中央高校基本科研业务费专项资金No.TD2014-02;国家自然科学基金No.61602042~~

摘  要:为了使中文问答系统能够准确高效地识别问句的语义,在构建生物医学领域本体的基础上,提出了一种基于浅层句法分析和最大熵模型的语义分析算法。该算法首先对自然语言问句进行语义块识别,如果识别成功,则形成问句向量,然后利用本体进行SPARQL查询;如果识别失败,则调用最大熵模型,判断问句的语义角色。最大熵模型利用标注好语义的熟语料进行训练,提取语义组块特征,从而判断出最可能的句型,形成问句向量,然后再利用本体进行查询,获取答案。通过实验与其他方法相比,新算法具有更高的查准率和召回率。In order to improve the accuracy and effectiveness of question semantic recognition in question answering system,this paper presents a semantic analyzing algorithm combining shallow parsing and the maximum entropy on the basis of constructing biomedical domain ontology.Firstly,natural language questions are identified by semantic blocks.If the recognition is successful,the question vectors are formed,and then the SPARQL query is performed on the ontology.Otherwise,the maximum entropy model is invoked to judge the semantic role of the question.The maximum entropy model is used to train annotated corpus,which extracts the semantic block features to determine the most probable sentence pattern and form question vector,and then query through ontology to get the answers.Finally,compared with other methods,the novel algorithm has higher precision and recall rate.

关 键 词:中文问答系统 本体 浅层句法分析 最大熵 SPARQL查询 

分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象