一种改进的最大频繁集发现算法被引量：1

An Improved Algorithm of Maximum Frequent Itemsets

出　　处：《计算机技术与发展》2008年第10期113-115,119,共4页Computer Technology and Development

基　　金：国家自然科学基金项目(40574002);广西自然科学基金项目(0448076)

摘　　要：关联规则是数据挖掘的主要技术,而最大频繁集是关联规则挖掘的核心。关联规则发现的准确性与效率的好坏直接决定了发现的知识规则是否适用。阐述了关联规则、频繁集和频繁超集的定义,分析了现有关联规则算法的思想及其不足,然后在概率的基础上引入了期望长,提出了ELMFI算法,最后用实例进行仿真实验并做了比较分析。该算法直接产生期望长度的候选项集并进行验算,试验结果验证了其可行性,发现效率有所提高,能节约大量的系统空间和运算时间。Association rules is the main technique for data mining, maximum frequent itemset is the key of association rules. The accuracy of the association rules and the quality of the efficiency come to a decision of whether knowledge rule apply or not. First elaborate the deftnition frequent itemset, frequent super itemset and association rules, analyze the thought and its shortage of the association rules. Then import expectation length based on probablity,put forward ELMFI algorithm. Finally,carry on analysis by using solid examples. This algo-rithm could economize a great deal of system space and the operation time, suitable for the large database.

关键词：关联规则最大频繁集期望长最小支持度数据挖掘

分类号：TP301.6[自动化与计算机技术—计算机系统结构]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种改进的最大频繁集发现算法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种改进的最大频繁集发现算法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种改进的最大频繁集发现算法被引量：1