检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京邮电大学计算机学院,江苏南京210003 [2]江苏省无线传感网高技术研究重点实验室,江苏南京210003 [3]南京师范大学虚拟地理环境教育部重点实验室,江苏南京210023
出 处:《南京师大学报(自然科学版)》2014年第1期30-34,共5页Journal of Nanjing Normal University(Natural Science Edition)
基 金:国家863项目(2012AA12A403);江苏省自然科学基金(BK2012833);江苏省高校自然科学基金(12KJB520011)
摘 要:自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取.实验表明,该方法具有较高的准确率和召回率.Natural language processing technology is an important direction in the field of computer science and artificial intelligence,and the Chinese text information extraction is a new rising researching field in recent years. Due to the character of the loose structure of Chinese text,the flexibility of grammar and semanteme,the research of Chinese natural language processing has a difficult challenge nowadays. In the paper, a method of the combine of syntactic and HMM (Hidden Markov Model) was proposed. The main idea is to use syntax to analyze the Chinese text,then submit the syntactic structure to HMM and get a HMM model through learning it,finally the event properties can be extracted by the HMM model. The experiment shows that the method has higher precision and recall than normal algorithm.
关 键 词:自然语言处理 中文文本信息抽取 隐马尔科夫模型 句法分析 触发词
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222