一种计算汉字串之间相关程度的新方法  被引量:6

A New Method for Calculating Relativity of Chinese Strings

在线阅读下载全文

作  者:曹娟[1] 周经野[1] 

机构地区:[1]湘潭大学信息工程学院,湖南湘潭411105

出  处:《中文信息学报》2004年第4期55-59,共5页Journal of Chinese Information Processing

基  金:湖南省自科基金资助项目 (0 2JJY2 0 92 )

摘  要:本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念———黏结度 ,并给出了其计算方法。该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论 ,通过加入上下文信息来提高分词的准确度 ;另外 ,该方法在引用汉字词频时 ,增加了对动态词频的考虑 ,可以自动识别未登陆的专业词汇。文中同时给出了黏结度在分词领域中的应用实例。通过与前人提出的相关信息的方法相比较 。In this paper we put forward a new concept, the degree of cohering of Chinese strings, and its computation. Its value reflects how close the two strings are interrelated. This method completely considered the environment of the Chinese strings and the local use frequency of the words. Its definition and the examples of applying it in word segmentation are presented。 Compared with the method of mutual information the predecessors had put forward, this method can solve some difficult problems in word segmentation and improves the precision.

关 键 词:计算机应用 中文信息处理 黏结度 相关信息 分词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象