检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:罗洋[1]
出 处:《计算机应用与软件》2013年第5期251-253,306,共4页Computer Applications and Software
摘 要:汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。详细介绍汉语自动分词的三种方法及五种词典机制,提出一种简洁而有效的中文分词词典机制,并通过理论分析和实验对比说明几种词典机制的效率差异来证明所提出分词词典机制的有效性。Automatic Chinese word segmentation is the prerequisite for Chinese information processing,and dictionary is the basis of automatic Chinese word segmentation.Whether a dictionary mechanism of word segmentation is good or bad directly affects the speed and efficiency of Chinese word segmentation.In this paper,three kinds of Chinese word segmentation means and five kinds of dictionary mechanisms are introduced in detail.In the end,a simple and effective dictionary mechanism for Chinese word segmentation is proposed.Furthermore,through theoretical analysis and experiment,we compare and illustrate the differences in efficiency of a couple of dictionary mechanisms,and use the conclusion to prove the effectiveness of our dictionary mechanism for word segmentation.
关 键 词:中文信息处理 自动分词 词典 哈希 二叉树 索引
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49