基于二阶HMM的信息抽取研究  被引量:3

Research on Information Extraction Based on Second-Order HMM

在线阅读下载全文

作  者:梁吉光[1] 田俊华[1] 熊玲[1] 

机构地区:[1]南京师范大学教育科学学院,南京210097

出  处:《情报杂志》2011年第7期169-171,141,共4页Journal of Intelligence

基  金:江苏省高校自然科学基础研究项目"面向主题的信息检索推理引擎技术研究"(编号:08KJD120004);全国教育科学规划2009年度中小学德育和校外教育研究专项立项课题"基于自动采集技术的优质中小学德育资源共建模式"(编号:GEA090005)

摘  要:隐马尔可夫模型是一种有效的信息抽取方法。二阶隐马尔可夫模型比一阶模型能够获取更多的上下文信息,考虑了转移概率和发射概率与历史状态的相关性,对状态具有更好的识别能力。提出了基于改进二阶隐马尔可夫模型的文本信息抽取模型,并对V iterb i算法进行了改进,对模型中的零概率事件给出了平滑算法。实验表明,改进二阶隐马尔可夫模型比传统模型具有更高的信息抽取准确率。Hidden Markov model is an effective approach for information extraction.The second-order hidden Markov model could get more contextual information than the first-order hidden Markov model does.Since the transition and emission probabilities depend on the historical states in the second-order hidden Markov model which has better performance of recognition for states,this paper proposes an improved text information extraction model based on the second-order hidden Markov model.The traditional viterbi algorithm is improved and a smooth algorithm is introduced to solve the zero probability problem.The improved model is proved to be more effective and precise than the second-order HMM.

关 键 词:隐马尔可夫模型 观察值 概率 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象