检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李景文[1] 刘军锋[1] 闫遂军[1] 邓晓斌[1]
机构地区:[1]桂林工学院,广西桂林541004
出 处:《计算机技术与发展》2008年第10期113-115,119,共4页Computer Technology and Development
基 金:国家自然科学基金项目(40574002);广西自然科学基金项目(0448076)
摘 要:关联规则是数据挖掘的主要技术,而最大频繁集是关联规则挖掘的核心。关联规则发现的准确性与效率的好坏直接决定了发现的知识规则是否适用。阐述了关联规则、频繁集和频繁超集的定义,分析了现有关联规则算法的思想及其不足,然后在概率的基础上引入了期望长,提出了ELMFI算法,最后用实例进行仿真实验并做了比较分析。该算法直接产生期望长度的候选项集并进行验算,试验结果验证了其可行性,发现效率有所提高,能节约大量的系统空间和运算时间。Association rules is the main technique for data mining, maximum frequent itemset is the key of association rules. The accuracy of the association rules and the quality of the efficiency come to a decision of whether knowledge rule apply or not. First elaborate the deftnition frequent itemset, frequent super itemset and association rules, analyze the thought and its shortage of the association rules. Then import expectation length based on probablity,put forward ELMFI algorithm. Finally,carry on analysis by using solid examples. This algo-rithm could economize a great deal of system space and the operation time, suitable for the large database.
关 键 词:关联规则 最大频繁集 期望长 最小支持度 数据挖掘
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229