检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南阳理工学院软件学院,河南南阳473000 [2]南阳理工学院图书馆,河南南阳473000 [3]大连理工大学创新实验学院,辽宁大连116624
出 处:《计算机工程与设计》2013年第12期4220-4225,共6页Computer Engineering and Design
基 金:国家自然科学基金项目(61173163)
摘 要:现有高效用项集挖掘算法主要采用项集枚举和两阶段方法 (或称为候选项集测试方法),后者时空效率的主要瓶颈在于候选项集过多。针对该问题,采用降低候选项集twu值,及利用项最大最小效用值来估计候选项集的效用值等策略,进而进行剪枝,从而有效地提高挖掘算法的时间和空间效率。实验采用真实数据集和合成数据集进行算法性能测试,实验结果表明改进后的算法性能得到较大的提高。Current approaches on high utility itemset mining are based on either itemset iteration or two-phase (also called candi date itemset testing), the performance bottleneck of the latter lies on too many candidates it generates. To address this issue, improved strategies is proposed to prune candidate itemsets, including reducing twu value, and estimating utility values of candidates using maximum & minimum item utility value, so as to efficiently improve the time and space efficiency of the mining algorithm. Both real and synthetic datasets are used in the performance test, and experimental results show that the revised algorithm is valid with significant improvement on performance.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222