一种基于双哈希二叉树的中文分词词典机制  被引量:4

A DICTIONARY MECHANISM FOR CHINESE WORD SEGMENTATION BASED ON DOUBLE HASH BINARY TREE

在线阅读下载全文

作  者:罗洋[1] 

机构地区:[1]鞍山师范学院高职院,辽宁鞍山114016

出  处:《计算机应用与软件》2013年第5期251-253,306,共4页Computer Applications and Software

摘  要:汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。详细介绍汉语自动分词的三种方法及五种词典机制,提出一种简洁而有效的中文分词词典机制,并通过理论分析和实验对比说明几种词典机制的效率差异来证明所提出分词词典机制的有效性。Automatic Chinese word segmentation is the prerequisite for Chinese information processing,and dictionary is the basis of automatic Chinese word segmentation.Whether a dictionary mechanism of word segmentation is good or bad directly affects the speed and efficiency of Chinese word segmentation.In this paper,three kinds of Chinese word segmentation means and five kinds of dictionary mechanisms are introduced in detail.In the end,a simple and effective dictionary mechanism for Chinese word segmentation is proposed.Furthermore,through theoretical analysis and experiment,we compare and illustrate the differences in efficiency of a couple of dictionary mechanisms,and use the conclusion to prove the effectiveness of our dictionary mechanism for word segmentation.

关 键 词:中文信息处理 自动分词 词典 哈希 二叉树 索引 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象