检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘俊辉[1] 王辉[1] 张强[1] 王浩畅[1] PAN Jun-Hui;WANG Hui;ZHANG Qiang;WANG Hao-Chang(School of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China)
机构地区:[1]东北石油大学计算机与信息技术学院,大庆163318
出 处:《计算机系统应用》2021年第9期242-246,共5页Computer Systems & Applications
基 金:国家自然科学基金(61702093);东北石油大学青年科学基金(2020QNL-02)。
摘 要:针对经典K-means聚类算法存在易陷入局部最优解的缺点,提出并实现了一种基于Hadoop的改进型遗传聚类算法.该算法利用遗传算法具有全局性和并行性的特点去处理K-means聚类算法易陷入局部最优的缺点,在此基础上对遗传算法进行改进,然后将改进后的遗传算法与K-means算法相结合,为提高算法执行效率,将其基于Hadoop平台进行了实现.通过实验将该改进方法与经典聚类算法进行对比分析,实验结果表明该方法在聚类准确性和聚类效率上均有较大的提高.Concerning the shortcoming that the classical K-means clustering algorithm is easy to fall into the local optimum,an improved genetic clustering algorithm based on Hadoop is proposed and implemented.The algorithm overcomes the above shortcoming with the globality and parallelism of the genetic algorithm.On this basis,the genetic algorithm is improved and then combined with the classical K-means algorithm.To improve the implementation efficiency,we implement the improved genetic clustering algorithm on Hadoop.The proposed method is compared with the classical clustering algorithm through experiments.The results show that the proposed method can greatly improve the clustering accuracy and efficiency.
关 键 词:K-MEANS 文本聚类 遗传算法 HADOOP 并行性
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.170