检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:严胜祥[1] 吴绍春[1] 吴耿锋[1] 金沈杰[1]
机构地区:[1]上海大学计算机工程与科学学院,上海200072
出 处:《计算机工程与科学》2004年第7期67-70,共4页Computer Engineering & Science
基 金:上海市科学技术发展基金资助项目 ( 0 1J14 0 2 2 ) ;上海市教委"第四期重点学科"项目 ( 2 0 5 15 3 )
摘 要:本文提出了一种处理多属性数据集的快速可扩展性并行分类算法—FSPC算法。它首次采用了纵向划分数据集以及在测试属性的选择过程中同步划分数据集等方法。实验结果表明 ,它不仅有利于减少通信及进行I/O的开销 ,而且有利于提高算法的并行度。We present a fast scalable parallel classification algorithm in this paper named FSPC to handle large databases with lots of attributes.It is the first algorithm to introduce several kinds of techniques such as partitioning databases vertically,and performing the split while finding split points.Experimental results show that these techniques can not only reduce communication and I/O costs,but also increase the algorithm parallelism.
关 键 词:数据挖掘 数据仓库 数据集 并行分类算法 FSPC算法 决策树 数据库
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.14.135.79