基于分类器集成的兼类词消歧研究  被引量:2

Research on Disambiguation of Multiple Syntactic Category Words Based on Ensemble of Classifiers

在线阅读下载全文

作  者:张一哲[1] 曲维光[2] 刘金克[1] 孙玉霞[1] 

机构地区:[1]南京师范大学计算机科学与技术学院,江苏南京210097 [2]江苏省信息安全保密技术工程研究中心,江苏南京210097

出  处:《南京师大学报(自然科学版)》2010年第4期144-147,152,共5页Journal of Nanjing Normal University(Natural Science Edition)

基  金:国家自然科学基金(60773173;61073119);国家"973"项目(2004CB318102);江苏省社科基金(06JSBYY001)

摘  要:兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.One of the difficuhies of Chinese word POS tagging is the disambiguation of muhiple syntactic category words. In order to tackle this problem, this article tries the ensemble of three classifiers of support vector machine, maximum entropy and conditional random fields. 410 often-used examples from People' s Daily corpus in January 1998 are used in the experiment, and the average precision is up to 89. 69%. This is a relative good result.

关 键 词:兼类词消歧 支持向量机 条件随机场 最大熵 分类器集成 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象