检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张一哲[1] 曲维光[2] 刘金克[1] 孙玉霞[1]
机构地区:[1]南京师范大学计算机科学与技术学院,江苏南京210097 [2]江苏省信息安全保密技术工程研究中心,江苏南京210097
出 处:《南京师大学报(自然科学版)》2010年第4期144-147,152,共5页Journal of Nanjing Normal University(Natural Science Edition)
基 金:国家自然科学基金(60773173;61073119);国家"973"项目(2004CB318102);江苏省社科基金(06JSBYY001)
摘 要:兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.One of the difficuhies of Chinese word POS tagging is the disambiguation of muhiple syntactic category words. In order to tackle this problem, this article tries the ensemble of three classifiers of support vector machine, maximum entropy and conditional random fields. 410 often-used examples from People' s Daily corpus in January 1998 are used in the experiment, and the average precision is up to 89. 69%. This is a relative good result.
关 键 词:兼类词消歧 支持向量机 条件随机场 最大熵 分类器集成
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.223.121.54