检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]智能技术与系统国家重点实验室清华大学计算机系,北京100084
出 处:《中文信息学报》2005年第1期63-70,共8页Journal of Chinese Information Processing
基 金:国家自然科学基金 (6 0 1330 0 0 8);国家 937基金 (G19980 30 5 0 7);国家高技术研究发展 836计划(2 0 0 1AA114 0 4 0 )
摘 要:本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结 ,最后根据分类算法对两部词典中同时收录非单一义项的词语进行双向意义联结。实验表明 ,本文提出的处理策略达到了 93%的信息融合正确率 ,融合后形成的新词典兼有词林的分类学信息和知网的概念描述信息。In this paper,we study the problem of merging information in HowNet and a Chinese thesaurus — TongYiCi CiLin. In order to integrate both the conception descriptions of words in HowNet and the semantic categories of words in TongYiCi CiLin,we propose several useful merging strategies: Firstly,we establish a DEF description for each SynSet in TongYiCi CiLin,which is similar with the word sense definition in HowNet.Then,we make bidirectional link for the words which have only one sense in both dictionaries.Finally we make bidirectional link for other words with multiple senses by using a classification algorithm based on salient frequency and vector distance of two sense descriptions.Experimental result shows that these merging strategies are effective and the merging accuracy is about 93%.The merged results form a new dictionary,which not only has semantic category of TongYi CiLin,but also has conception description of HowNet.
关 键 词:计算机应用 中文信息处理 词典信息融合 知网 同义词词林 分类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.195