检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《中文信息学报》2004年第4期55-59,共5页Journal of Chinese Information Processing
基 金:湖南省自科基金资助项目 (0 2JJY2 0 92 )
摘 要:本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念———黏结度 ,并给出了其计算方法。该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论 ,通过加入上下文信息来提高分词的准确度 ;另外 ,该方法在引用汉字词频时 ,增加了对动态词频的考虑 ,可以自动识别未登陆的专业词汇。文中同时给出了黏结度在分词领域中的应用实例。通过与前人提出的相关信息的方法相比较 。In this paper we put forward a new concept, the degree of cohering of Chinese strings, and its computation. Its value reflects how close the two strings are interrelated. This method completely considered the environment of the Chinese strings and the local use frequency of the words. Its definition and the examples of applying it in word segmentation are presented。 Compared with the method of mutual information the predecessors had put forward, this method can solve some difficult problems in word segmentation and improves the precision.
关 键 词:计算机应用 中文信息处理 黏结度 相关信息 分词
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.173