基于MapReduce的朴素贝叶斯文本分类研究  被引量:1

Naive Bayes Text Classification Algorithm Based on MapReduce

在线阅读下载全文

作  者:严嘉铭 黄理灿[1] 

机构地区:[1]浙江理工大学信息学院,浙江杭州310018

出  处:《工业控制计算机》2016年第4期96-97,100,共3页Industrial Control Computer

摘  要:随着互联网的到来,其技术的发展导致了各种数据呈现出爆发式的增长,比如文本数据,分类算法在海量数据前面临着新的挑战。为了解决传统朴素贝叶斯分类算法在面临挑战中的不足,对其中关键词进行加权来提高分类准确率,然后通过Map Reduce编程模型,设计出朴素贝叶斯算法在Hadoop平台下的实现。实验表明:在Hadoop集群上通过并行化的设计朴素贝叶斯分类算法展现出了良好的性能,同时表现出了可靠的扩展性。With the advent of the Internet,the development of technology has led to a variety of data showing explosive growth,such as text data,and the massive data classification algorithm is facing new challenges.In order to solve the traditional Bayesian classifier algorithm insufficient of facing challenges,this paper weights keywords to improve classification accuracy,then through the Map Reduce programming model,naive Bayes algorithm devised at Hadoop platform.

关 键 词:HADOOP MAPREDUCE 文本分类 贝叶斯分类 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象