一种改进的MM中文分词算法  

An Improved Maximum Matching Method for Chinese Word Segmentation

在线阅读下载全文

作  者:石正喜[1] 张捍东[1] 赵黎明[1] 陈玉燕[2] 

机构地区:[1]宁波城市职业技术学院信息学院,浙江宁波315100 [2]安徽工业大学电气信息学院,安徽马鞍山243000

出  处:《计算机与网络》2009年第2期48-50,54,共4页Computer & Network

摘  要:对汉语的特点和分词概念作了简单介绍,详细说明了常用的分词算法,在此基础上,提出了一种改进的MM中文分词算法。该算法兼顾了最大正向匹配法(MM)和逆向最大匹配法(RMM)的优点,克服他们的不足,使得切分准确率和分词效率均有明显的提高,是一种比较实用的分词算法。实验也进一步证明,该算法能有效地提高切分准确率和分词效率。It introduces briefly the conception of word segmentation and characteristic of chinese, explains detailedly the method of ordinary word segmentation and puts forward an improved Maximum Matching Method (MM) for chinese word segmentation. This method is an applied method for chinese word segmentation, and it has the advantage Maximum Matching Method (MM) and Reverse Maximum Matcing Method (RMM) and overcomes their shortcomings. So it obtains obvious improvement for the exact probability and efficiency of Chinese word segmentation, it is proved through practices that this method can improve efficiently the exact probability and efficiency of Chinese word segmentation.

关 键 词:自然语言处理 中文分词 改进的最大匹配法 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象