检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京师范大学信息网络中心,北京100875 [2]北京邮电大学网络与交换技术国家重点实验室,北京100876
出 处:《北京邮电大学学报》2009年第B04期49-52,共4页Journal of Beijing University of Posts and Telecommunications
基 金:国家自然科学基金项目(6080203460672122);高等学校博士学科点专项科研基金项目(20070013026);北京市科技新星计划(2008B50)
摘 要:提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘.采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题.并给出了指导该并行算法高效计算的方法.数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.Working on the group of personal-computers and servers, a parallel C4.5 decision tree algorithm is proposed. This algorithm made the parallel date mining run on the data mining grid efficiently. A partition of vertical and horizontal method is introduced to parallel the procedure of recursive algorithm. The algorithm is scalable and solves the situation of lack of efficient parallel algorithm so far. The analysis and experiment for the parallel decision tree prove that the computing efficiency is affected by several parameters and the algorithm has high performance and high computing speedup. Guides to enhance the efficiency are proposed as well.
分 类 号:TP302.7[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.226.159.13