检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《辽宁大学学报(自然科学版)》2013年第1期41-47,共7页Journal of Liaoning University:Natural Sciences Edition
基 金:教育部人文社会科学研究青年基金(12YJCZH048);辽宁‘百千万人才工程’培养经费资助
摘 要:随着互联网技术的快速发展与普及,尤其是Web2.0时代的来临,网络数据量与日俱增.对新增数据进行挖掘成为数据挖掘领域研究的热点之一.基于存在全局站点的分布式数据挖掘思想,提出了一种存在全局站点的分布式增量挖掘算法.首先对局部站点的增量数据进行全局挖掘,有效减少了局部站点对原有数据的扫描次数;然后在全局站点采用新的剪枝策略,极大地降低了产生的候选集数量;最后通过实例验证了所给算法切实可行,并具有较好的挖掘效率.With the rapid growth and widespread of Internet techniques,especially the coming of web2.0,the amount of network data has increased sharply.The mining of increment data has become a hot spot of data mining area.Based on distributed data mining with global site,this paper puts forward an incremental mining algorithm for distributed database with global site(IMADG).Firstly,IMADG applies global mining to the data of local site and reduces the scan times to the original local data.Secondly,IMADG requires far less candidate item sets by using new pruning strategy on global site.Finally,IMADG is verified effective through an example.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222