一种基于变型B-树的中文自动分词词典机制  被引量:1

在线阅读下载全文

作  者:吴昊[1] 潘无名[1] 王硕[1] 杨博[1] 

机构地区:[1]四川大学计算机学院,成都610065

出  处:《技术与市场》2007年第4期37-38,共2页Technology and Market

摘  要:中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素。本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度。

关 键 词:分词 B-树 二分查找 中文自动分词词典 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象