基于最大熵模型的汉语词义消歧与标注方法被引量：8

Approach to Chinese Word Sense Disambiguation and Tagging Based on Maximum Entropy Models

机构地区：[1]北京信息科技大学智能信息处理研究所,北京100192 [2]中国科学院自动化所模式识别国家重点实验室,北京100080

出　　处：《计算机工程》2009年第18期15-18,共4页Computer Engineering

基　　金：国家自然科学基金资助项目(60873013);北京市自然科学基金B类资助重点项目(KZ200811232019);中科院自动化所模式识别国家重点实验室开放专项经费基金资助项目;北京市属市管高校人才强教计划基金资助项目(PXM2008_014215_055942)

摘　　要：分析最大熵模型开源代码的原理和各参数的意义,采用频次和平均互信息相结合特征筛选和过滤方法,用Delphi语言编程实现汉语词义消歧的最大熵模型,运用GIS(Generalized Iterative Scaling)算法计算模型的参数。结合一些语言知识规则解决训练语料的数据稀疏问题,所实现的汉语词义消歧与标注系统,对800多个多义词进行词义标注,取得了较好的标注正确率。This paper analyzes the principle and every parameter meaning of open-source code of maximum entropy models, uses the method of the combination of feature frequency and average mutual information to select the features from the candidate feature set, realizes the maximum entropy models for Chinese Word Sense Disambiguation（WSD） by Delphi, and computes models parameters by GIS algorithm. It solves the data sparseness problem by combining the linguistic knowledge. The system for Chinese word sense automatic disambiguation and tagging is implemented. It uses the system to tag word sense of more than 800 multivocal words, and lives the better correcte rate.

关键词：词义消歧与标注最大熵模型上下文特征特征筛选

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于最大熵模型的汉语词义消歧与标注方法被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于最大熵模型的汉语词义消歧与标注方法 被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于最大熵模型的汉语词义消歧与标注方法被引量：8