Nutch0.9中二分法中文分词的实现  

在线阅读下载全文

作  者:刘高原[1] 何伟娜[1] 郑浩[1] 刘觉夫[2] 

机构地区:[1]平顶山学院,河南平顶山467000 [2]华东交通大学

出  处:《计算机时代》2009年第4期28-30,共3页Computer Era

基  金:江西省自然科学基金项目(0311046)

摘  要:Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询。Nutch0.9较好地处理了英文分词,但对中文分词处理还不够完善。文章介绍了在Nutch0.9中实现索引及检索的二分法,提出了改进中文分词的方法。

关 键 词:Nutch0.9 二分法 索引 检索 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象