一种改进的最大频繁集发现算法  被引量:1

An Improved Algorithm of Maximum Frequent Itemsets

在线阅读下载全文

作  者:李景文[1] 刘军锋[1] 闫遂军[1] 邓晓斌[1] 

机构地区:[1]桂林工学院,广西桂林541004

出  处:《计算机技术与发展》2008年第10期113-115,119,共4页Computer Technology and Development

基  金:国家自然科学基金项目(40574002);广西自然科学基金项目(0448076)

摘  要:关联规则是数据挖掘的主要技术,而最大频繁集是关联规则挖掘的核心。关联规则发现的准确性与效率的好坏直接决定了发现的知识规则是否适用。阐述了关联规则、频繁集和频繁超集的定义,分析了现有关联规则算法的思想及其不足,然后在概率的基础上引入了期望长,提出了ELMFI算法,最后用实例进行仿真实验并做了比较分析。该算法直接产生期望长度的候选项集并进行验算,试验结果验证了其可行性,发现效率有所提高,能节约大量的系统空间和运算时间。Association rules is the main technique for data mining, maximum frequent itemset is the key of association rules. The accuracy of the association rules and the quality of the efficiency come to a decision of whether knowledge rule apply or not. First elaborate the deftnition frequent itemset, frequent super itemset and association rules, analyze the thought and its shortage of the association rules. Then import expectation length based on probablity,put forward ELMFI algorithm. Finally,carry on analysis by using solid examples. This algo-rithm could economize a great deal of system space and the operation time, suitable for the large database.

关 键 词:关联规则 最大频繁集 期望长 最小支持度 数据挖掘 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象