HMM模型和句法分析相结合的事件属性信息抽取  被引量:10

Research of the Extraction Method of Event Properties Based on the Combining of HMM and Syntactic Analysis

在线阅读下载全文

作  者:吴家皋[1,2] 周凡坤 张雪英[3] 

机构地区:[1]南京邮电大学计算机学院,江苏南京210003 [2]江苏省无线传感网高技术研究重点实验室,江苏南京210003 [3]南京师范大学虚拟地理环境教育部重点实验室,江苏南京210023

出  处:《南京师大学报(自然科学版)》2014年第1期30-34,共5页Journal of Nanjing Normal University(Natural Science Edition)

基  金:国家863项目(2012AA12A403);江苏省自然科学基金(BK2012833);江苏省高校自然科学基金(12KJB520011)

摘  要:自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取.实验表明,该方法具有较高的准确率和召回率.Natural language processing technology is an important direction in the field of computer science and artificial intelligence,and the Chinese text information extraction is a new rising researching field in recent years. Due to the character of the loose structure of Chinese text,the flexibility of grammar and semanteme,the research of Chinese natural language processing has a difficult challenge nowadays. In the paper, a method of the combine of syntactic and HMM (Hidden Markov Model) was proposed. The main idea is to use syntax to analyze the Chinese text,then submit the syntactic structure to HMM and get a HMM model through learning it,finally the event properties can be extracted by the HMM model. The experiment shows that the method has higher precision and recall than normal algorithm.

关 键 词:自然语言处理 中文文本信息抽取 隐马尔科夫模型 句法分析 触发词 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象