一种改进的MM分词算法  被引量:39

An Improved Maximum Matching Method for Chinese Word Segmentation

在线阅读下载全文

作  者:郭辉[1] 苏中义[1] 王文 崔骏 

机构地区:[1]上海交通大学信息与控制工程系,硕士研究生上海200240

出  处:《微型电脑应用》2002年第1期13-15,共3页Microcomputer Applications

摘  要:本文首先提出一种对中文句子进行分词预处理的方法 ,在预处理过程中就能完成分词过程中所有的数据库访问操作 ,这种方法可以不加修改地应用于所有机械分词算法以及消除歧义 ;然后在预处理的基础上实现一种改进的MM法 ,更加完全地遵照“长词优先”的原则 ,使分词系统在机械分词阶段能有比In this paper, a pretreatment method for Chinese word segmentation is introduced. Using it, all operations of access to the database in the segmentation process tare completed in the pretreatment phase. This method can also be used for algorithms of automatic segmentation and ambiguity diminishing. Then this paper proposes an improved Maximum Matching Method (MM) based on the pretreatment method, which achieves better effects based on the principle of ″Longer Word First″.

关 键 词:自然语言处理 最大匹配法 MM分词算法 计算机 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象