检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘芝怡[1]
机构地区:[1]常州工学院计算机信息工程学院,江苏常州213002
出 处:《科技通报》2014年第6期119-121,共3页Bulletin of Science and Technology
摘 要:研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。The frequent itemsets mining optimization model is researched. Traditional mining is often produce large-scale candidate itemsets, and repeatedly scanning database, the time is too long, lead to frequent itemsets mining space efficien-cy is too low. Frequent itemset mining is to improve the problem of low efficiency of time and space, put forward an efficient algorithm for mining frequent itemsets CPT-Mine. The algorithm using encoding scheme tree store information of frequent itemsets of transaction databases construction of FP array, to speed up the produce frequent itemsets, the introduction of CPT-Mine algorithm, fast, frequent itemsets mining database contains no recursive model tree structure conditions, only two times of scanning database can generate all frequent itemsets. The experiment proves that this algorithm can shorten the mining time 3~10 s, space efficiency increased by 43%.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33