中文分词技术的研究及在Nutch中的实现  被引量:3

在线阅读下载全文

作  者:王巧玲[1] 彭静[1] 王春红[1] 

机构地区:[1]河北科技大学信息科学与工程学院,河北石家庄050018

出  处:《科技信息》2011年第19期I0038-I0039,共2页Science & Technology Information

基  金:河北省科技支撑计划项目资助(10213557)

摘  要:研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。

关 键 词:NUTCH 中文分词 搜索引擎 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象