检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京信息职业技术学院信息服务学院,南京210023
出 处:《信息化研究》2015年第5期28-33,共6页INFORMATIZATION RESEARCH
摘 要:生成频繁项集是约束关联规则挖掘中最耗时的一步。为提高挖掘的效率,文章提出一种基于十字链表的经典的约束算法(Separate)改进算法(SABCL)。该算法结合Separate算法和十字链表存储的优势,先根据约束条件过滤数据库并产生频繁项目,再利用十字链表存储频繁项目信息,通过遍历十字链表生成满足约束条件的频繁项集,从而避免重复扫描数据库,提高了挖掘效率。在美国蘑菇(mushroom)、象棋(chess)数据集上,对SABCL、Separate算法进行了实验对比,实验结果表明,在相同的条件下,SABCL算法能够快速地生成所有的频繁项集,时间性能优于Separate算法。Generating frequent item sets in constraint association rules mining is the most time consuming step.To improve the efficiency of mining,an improved algorithm named separate based on across linker(SABCL)is proposed.The algorithm combines the advantages of the algorithm named Separate and across linker in the storage.Firstly,database is filtered and frequent item is generated by the constraint condition.Then the frequent item's information is stored by across linker and the frequent item sets that meet constraints are generated by traversing the across linker to avoid scanning database repeatedly and improve the mining efficiency.Finally,We compared the run time of SABCL,Seperate algorithm in mushroom and chess datase.The experimental results indicate that SABCL can quickly generate all frequent item sets,and has better time performance than Separate algorithm in the same conditions.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15