检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学计算机与信息学院,合肥230009
出 处:《计算机应用研究》2016年第7期1936-1940,共5页Application Research of Computers
基 金:国家"863"计划资助项目(2012AA011005);国家自然科学基金资助项目(61273292)
摘 要:频繁项集挖掘是数据挖掘应用中的关键问题,而巨大的频繁项集数目成为了现实应用中的阻碍。为了降低频繁项集数量,使其更加利于应用,提出了一种基于格结构的频繁项集精简模型,并证明了该方法产生支持度误差的范围;此外,在模型的基础上提出了一种模糊等价类精简表示算法FEC。实验结果表明,该方法能够保证在频繁项集数量大幅降低的同时,不会引入过大的支持度错误,与Index-Meta算法相比,产生的支持度错误较小。因此,基于模糊等价类的频繁项集精简表示模型及FEC算法有较高的应用价值。Frequent itemset mining is a main problem in the application of data mining. But the large number of the frequent itemset makes it hard to apply. To reduce the number of frequent itemsets, this paper proposed a concise representation model of frequent itemset based on concept lattices. It proved the feasibility of the model and deduced the range of support error. In addition, this paper proposed a algorithm of fuzzy eqivalence based on the model which was called FEC. Experimental results show that this algorithm can reduce the number of frequent itemset sharply and the support error is also very low. The support error is much smaller than that of Index-Meta. So this method has great application value.
关 键 词:数据挖掘 模糊等价类 类闭合集 频繁项集 精简表示 关联规则
分 类 号:TP301.4[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117