基于隐马尔可夫模型的文本信息抽取被引量：52

Text Information Extraction Based on Hidden Markov Model

出　　处：《系统仿真学报》2004年第3期507-510,共4页Journal of System Simulation

基　　金：国家自然科学基金(60272051)

摘　　要：文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。Text information extraction is an important method of processing large quantity of text. The application of hidden Markov model to information extraction is a relatively new research topic. A new algorithm based on hidden Markov Model is proposed for text information extraction. The algorithm makes use of the information of format and list separators to segment text, and then combines hidden Markov model for text information extraction. The simulation results show that the new algorithm exceeds the original one that hasnt segment text into blocks in precision and recall.

关键词：隐马尔可夫模型信息抽取文本分块机器学习

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于隐马尔可夫模型的文本信息抽取被引量：52

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于隐马尔可夫模型的文本信息抽取 被引量：52

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于隐马尔可夫模型的文本信息抽取被引量：52