检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:姚亮[1]
出 处:《微计算机信息》2010年第18期154-156,共3页Control & Automation
摘 要:在数据挖掘中关联规则是一个重要的研究方向。Apriori算法是关联规则中最著名的算法。本文针对Apriori算法的缺陷,提出一种改进算法(SAVM)。新算法采用向量运算来实现项集支持度计数,大大减少扫描数据库的次数;运用hash函数直接生成频繁2项集;利用基于前缀的划分方法对频繁项集Lk-1进行划分,在相对较小的独立子空间内进行连接生成候选k-项集,减少连接过程中模式匹配的次数,提高连接速度。实验证明,改进算法大幅提高了原算法的效率。Association rule is an important research direction in data mining. The Apriori algorithm is a classical algorithm in mining association rules. In this paper, we point out the shortage of Apriori algorithm and present an improved one (SAVM). This improved Apriori algorithm uses the operation of vector to get supporting degree of items, applys the Hash function to generate 2-item sets directly, reduces the frequency of database scanning and divides frequent item sets Lk-1 based on prefix to generate candidate k-item sets in a relative small subspace, which can reduce the times of mode matching and improve the speed of joint. The experiments show that the improved Apriori algorithm is high efficiency.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38