一种在MapReduce下实现的KNN改进算法  被引量:2

An Improved KNN Algorithm Based on MapReduce

在线阅读下载全文

作  者:潘俊辉[1] 王辉[1] 张强[1] 王浩畅[1] PAN Junhui;WANG Hui;ZHANG Qiang;WANG Haochang(School of Computer and Information Technology,Northeast Petroleum University,Daqing Heilongjiang 163318,China)

机构地区:[1]东北石油大学计算机与信息技术学院,黑龙江大庆163318

出  处:《重庆科技学院学报(自然科学版)》2021年第1期70-72,95,共4页Journal of Chongqing University of Science and Technology:Natural Sciences Edition

基  金:国家自然科学基金项目“基于计算智能的油田措施规划模型及优化算法研究”(61702093);东北石油大学青年科学基金项目“Hadoop平台下数据挖掘算法的研究与实现”(2020QNL-02)。

摘  要:在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长。对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现。实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间。In the process of text classification,the classical nearest neighbor classification algorithm( KNN) takes a long time in the face of massive data. In order to improve the classical KNN algorithm,the primary classifier is constructed to reduce the calculation amount in the training stage,and it is implemented in the Hadoop platform MapReduce. Experimental results show that the improved algorithm can save running time while ensuring classification accuracy.

关 键 词:文本分类 最近邻分类 初级分类器 HADOOP平台 程序运行时间 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象