检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘俊辉[1] 王辉[1] 张强[1] 王浩畅[1] PAN Junhui;WANG Hui;ZHANG Qiang;WANG Haochang(School of Computer and Information Technology,Northeast Petroleum University,Daqing Heilongjiang 163318,China)
机构地区:[1]东北石油大学计算机与信息技术学院,黑龙江大庆163318
出 处:《重庆科技学院学报(自然科学版)》2021年第1期70-72,95,共4页Journal of Chongqing University of Science and Technology:Natural Sciences Edition
基 金:国家自然科学基金项目“基于计算智能的油田措施规划模型及优化算法研究”(61702093);东北石油大学青年科学基金项目“Hadoop平台下数据挖掘算法的研究与实现”(2020QNL-02)。
摘 要:在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长。对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现。实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间。In the process of text classification,the classical nearest neighbor classification algorithm( KNN) takes a long time in the face of massive data. In order to improve the classical KNN algorithm,the primary classifier is constructed to reduce the calculation amount in the training stage,and it is implemented in the Hadoop platform MapReduce. Experimental results show that the improved algorithm can save running time while ensuring classification accuracy.
关 键 词:文本分类 最近邻分类 初级分类器 HADOOP平台 程序运行时间
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249