检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:辛日华[1]
机构地区:[1]呼伦贝尔学院计算机科学与技术学院,内蒙古海拉尔021008
出 处:《内蒙古师范大学学报(自然科学汉文版)》2014年第1期106-109,113,共5页Journal of Inner Mongolia Normal University(Natural Science Edition)
基 金:内蒙古自然科学基金资助项目(2013MS0102)
摘 要:在自行研究和开发的基于知网的语义剪枝系统中,对大规模语料库中的语料多义词进行知网释义的自动提取,然后进行语义剪枝.将语义剪枝系统的实验结果与人工标注的结果相比,来解决自然语言处理过程中的词义排歧问题.其目的是通过语义剪枝系统尽可能地减少歧义词在上下文中的错误的或最不可能的义项.语义剪枝后形成一个词和其可能义项的列表,尽量将一个词真正正确的义项保留下来.使用召回率和简化率两个指标对语义剪枝算法进行评价,结果表明窗口尺寸和分析单元的选取对召回率和简化率有影响.A semantic pruning system based on "HowNet" is researched and developed. Automatic extraction and semantic pruning about polysemants of HowNet interpretations in large-scale corpus are studied. Through comparing the experimental results between semantic pruning system and manual labe- ling,The word sense disambiguation in natural language processing can be solved. The wrong items or the most unlikely items in context is as far as possible reduced through semantic pruning system. Then, A word and A possible meaning list retaining the real meaning of it are formed, finally,the results shows the influence of recall and simplified rate due to the window scale and the analysis unit selection by using Recall and simplified rate to evaluate.
分 类 号:TP273[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.131.93.117