检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:石正喜[1] 张捍东[1] 赵黎明[1] 陈玉燕[2]
机构地区:[1]宁波城市职业技术学院信息学院,浙江宁波315100 [2]安徽工业大学电气信息学院,安徽马鞍山243000
出 处:《计算机与网络》2009年第2期48-50,54,共4页Computer & Network
摘 要:对汉语的特点和分词概念作了简单介绍,详细说明了常用的分词算法,在此基础上,提出了一种改进的MM中文分词算法。该算法兼顾了最大正向匹配法(MM)和逆向最大匹配法(RMM)的优点,克服他们的不足,使得切分准确率和分词效率均有明显的提高,是一种比较实用的分词算法。实验也进一步证明,该算法能有效地提高切分准确率和分词效率。It introduces briefly the conception of word segmentation and characteristic of chinese, explains detailedly the method of ordinary word segmentation and puts forward an improved Maximum Matching Method (MM) for chinese word segmentation. This method is an applied method for chinese word segmentation, and it has the advantage Maximum Matching Method (MM) and Reverse Maximum Matcing Method (RMM) and overcomes their shortcomings. So it obtains obvious improvement for the exact probability and efficiency of Chinese word segmentation, it is proved through practices that this method can improve efficiently the exact probability and efficiency of Chinese word segmentation.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117