基于隐马尔可夫模型的文本信息抽取  被引量:52

Text Information Extraction Based on Hidden Markov Model

在线阅读下载全文

作  者:刘云中[1] 林亚平[1] 陈治平[1] 

机构地区:[1]湖南大学计算机与通信学院,湖南长沙410082

出  处:《系统仿真学报》2004年第3期507-510,共4页Journal of System Simulation

基  金:国家自然科学基金(60272051)

摘  要:文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。Text information extraction is an important method of processing large quantity of text. The application of hidden Markov model to information extraction is a relatively new research topic. A new algorithm based on hidden Markov Model is proposed for text information extraction. The algorithm makes use of the information of format and list separators to segment text, and then combines hidden Markov model for text information extraction. The simulation results show that the new algorithm exceeds the original one that hasnt segment text into blocks in precision and recall.

关 键 词:隐马尔可夫模型 信息抽取 文本分块 机器学习 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象