基于最大熵的汉语短语结构识别方法  被引量:3

Recognition Method of Chinese Phrase Structure Based on Maximum Entropy

在线阅读下载全文

作  者:霍亚格[1] 黄广君[1] 

机构地区:[1]河南科技大学电子信息工程学院,河南洛阳471003

出  处:《计算机工程》2011年第16期206-208,211,共4页Computer Engineering

基  金:河南省科技攻关计划基金资助项目(102102210159)

摘  要:为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实现对句子短语结构的识别。实例证明,基于互信息的最大熵模型能取得较好的精确率和召回率。To improve the computer's processing capacity on Chinese information,and do better shallow parsing,this paper presents a recognition method of Chinese phrase structure based on Maximum Entropy(ME).The Mutual Information(MI) among the phrases is proposed to achieve boundary prediction of the sentences structure,and the ME model is used to set up atomic and composite templates,selects more effective features for constituting the final feature set.The identification of phrase structure is completed by using the ME method,and good precision and recall are proved in the ME model based on MI by the practical experiment.

关 键 词:浅层句法分析 互信息 边界预测 最大熵模型 特征选择 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象