检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]长沙理工大学,410114
出 处:《微计算机信息》2011年第10期159-161,共3页Control & Automation
基 金:湖南省自然科学基金项目(07JJ3120)
摘 要:基于词典的中文分词技术,构建一个时空性能良好的词典机制是很重要,因此在这篇论文中,设计并实现了一种改进的中文分词词典机制,通过引进位图这种数据结构来标识二字词是否存在于词典当中。分析时间复杂度跟空间复杂度后:时间复杂度跟文献中一致,空间复杂度降低了。并且使用最大正向匹配算法与其它文献的词典机制进行对比,分析对比实验数据后表明:该词典机制时间消耗保持不变,内存使用量降低。It is so import to build a dictionary mechanism with good space-time performance about chinese segmentation technology based dictionary that we design and implement a improved chinese segmentation dictionary construction in this paper.and we introduce the data structure of bitmap to indicate whether the two-word words is in the dictionary or not.after the analysis of time complexity and space complexity,this paper introduce the structure of bitmap and the efficiency of the dictionary construction is the same as the effciency of the paper of the other,and the complexity of this paper is more lower to some extent.then we make use of the FMM algorithm to make comparison with the dictionary construction of other paper,and the experiment show that time consumption is not change and memory usage is more lower.
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7