检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄德根[1] 张丽静[1] 张艳丽[1] 杨元生[1]
出 处:《小型微型计算机系统》2003年第7期1252-1255,共4页Journal of Chinese Computer Systems
基 金:国家自然科学基金 ( 60 14 3 0 0 2 )资助
摘 要:兼类词处理是词性标注的关键所在 ,本文对兼类词排岐进行了研究 ,介绍了规则和统计相结合的排岐策略 .按照上述策略 ,实现了一个兼类词处理系统 .实验测试结果表明 ,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率 ,在封闭测试和开放测试中兼类词的排歧正确率分别达到了 93.91%和 91.16 % ,标注正确率分别达到了 97.85 %和 96 .71% .Syntactic category disambiguation is the key to part of speech tagging .In this paper, westudy the syntactic category disambiguation and introduce the disambiguation strategy using rule techniques and statistics techniques. With the above method, a system of disambiguation is materialized. The experimental results show the tagging accuracy is raised by using rule techniques and statistics techniques .The disambiguation accuracy of close test and open test is 93.91% and 91.16% respectively, and the overall accuracy is 97.85% and 96.71% respectively.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145