检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]空军雷达学院预警监视情报系,湖北武汉430019
出 处:《计算机工程与设计》2011年第10期3424-3427,共4页Computer Engineering and Design
基 金:国家自然科学基金项目(60736009)
摘 要:为解决传统关联规则挖掘算法对大规模连续数据库进行挖掘时所产生的信息损失和效率低下等问题,给出一种改进的模糊关联规则挖掘算法,称为F-ARMVLQD算法。该算法利用模糊均值聚类算法解决离散属性间隔之间出现"尖锐边界"的问题,同时算法引入有向无环图和字节向量用以提高频繁项目集的计算效率,并吸取分区算法的优势,解决对该数据库挖掘时磁盘操作频繁的问题,整个算法只需扫描两次数据库。实验结果表明,该算法比传统算法具有更高的执行效率。To address the information loss and the low efficiency problem in the process of mining the association rules on the large database with continuous attributes by the traditional algorithm, an improved algorithm of fuzzy association rule mining named F-ARMVLQD is suggested. FCM (fuzzy c-means) is used to solve the "sharp boundary" problems between the discretizing attribute intervals. Meanwhile, the algorithm improves the computational efficiency of frequent itemsets by introducing the DAG (directed acyclic graphs) and the byte-vector structure, and draws the advantages of partition algorithm for reducing the I/O overhead generated during the database mining. The algorithm needs to scan the database for only twice. Experimental results show that the algorithm has a better performance than the traditional algorithm.
关 键 词:大型数据库 模糊C-均值聚类算法 连续属性 字节向量结构 分区算法
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.104