检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]杭州商学院计算机信息工程学院,杭州310035
出 处:《计算机应用与软件》2003年第9期8-10,共3页Computer Applications and Software
基 金:浙江省自然科学基金(60 2 1 4 0 ) ;国家 863计划 (2 0 0 2AA1 2 1 0 64) ;浙江省教育厅科技计划(2 0 0 2 0 635)
摘 要:本文首先提出了一种挖掘频集的高效算法PP。它采用了一种基于树的模式支持集表示 ,避免了反复扫描数据库和递归建造个数与频繁模式数相同的模式支持集 ,其效率比Apriori和FPGrowth高 1~ 3个数量级。PP被进一步扩展成发现分类规则的有效算法CRM PP。CRM PP将多支持率剪裁集成到频集发现阶段 ,将二阶段挖掘法改进为单阶段挖掘法。CRM PP的效率也比基于Apriori和FPGrowth的二阶段算法高 1~In this paper,an efficient algorithm,called PP(Pseudo Projection),is proposed to discover frequent patterns.PP represents subsets of transactions that support patterns by a tree based structure which avoids repetitive scans of databases and recursive materializations of transaction subsets.PP is one to three orders of magnitude efficient than Apriori and FPGrowth.Then,PP is extended into another efficient algorithm,called CRM PP,to mine classification rules.CRM PP pushes multiple minimum supports threshold into the discovery stage of frequent patterns,and generates rules in the same stage.CRM PP is also one to three orders of magnitude efficient than algorithms derived from Apriori and FPGrowth.
关 键 词:数据挖掘 虚拟投影算法 分类规则 数据库 模式支持集
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222