检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐嘉莉[1] 陈佳[2] 胡庆[1] 黄波[1] 郭红霞[1]
机构地区:[1]成都大学电子信息工程学院,成都610106 [2]电子科技大学计算机科学与工程学院,成都610054
出 处:《计算机应用研究》2012年第3期837-840,共4页Application Research of Computers
基 金:国家"863"计划资助项目(2007AA01Z443);成都大学校基金资助项目(2010XJZ16)
摘 要:针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。This paper proposed an algorithm based on vector for mining maximal frequent itemsets in sliding window over data streams(MFISW) aimed at the mining problems of maximal frequent itemsets over data streams.Firstly,the algorithm used vector to express items in data streams and solved the problem of time granularity through quantitative updating strategies.Secondly,it stored the ancillary information using a matrice and a array in creating the frequent sets through the bit operation,and improved the mining efficiency again using pruning technology during creating the maximal frequent sets.Finally,it improved the detecting efficiency by using a index list to store mining results.Theoretical analysis and experimental results show the algorithm is efficient.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.60