改进的基于位图的中文分词词典  

An Improved Chinese Segmentation Dictionary Based Bitmap

在线阅读下载全文

作  者:罗会红[1] 傅明[1] 

机构地区:[1]长沙理工大学,410114

出  处:《微计算机信息》2011年第10期159-161,共3页Control & Automation

基  金:湖南省自然科学基金项目(07JJ3120)

摘  要:基于词典的中文分词技术,构建一个时空性能良好的词典机制是很重要,因此在这篇论文中,设计并实现了一种改进的中文分词词典机制,通过引进位图这种数据结构来标识二字词是否存在于词典当中。分析时间复杂度跟空间复杂度后:时间复杂度跟文献中一致,空间复杂度降低了。并且使用最大正向匹配算法与其它文献的词典机制进行对比,分析对比实验数据后表明:该词典机制时间消耗保持不变,内存使用量降低。It is so import to build a dictionary mechanism with good space-time performance about chinese segmentation technology based dictionary that we design and implement a improved chinese segmentation dictionary construction in this paper.and we introduce the data structure of bitmap to indicate whether the two-word words is in the dictionary or not.after the analysis of time complexity and space complexity,this paper introduce the structure of bitmap and the efficiency of the dictionary construction is the same as the effciency of the paper of the other,and the complexity of this paper is more lower to some extent.then we make use of the FMM algorithm to make comparison with the dictionary construction of other paper,and the experiment show that time consumption is not change and memory usage is more lower.

关 键 词:中文分词 位图 前向最大匹配算法 TIRE树 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象