检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈小玉[1] 杨艳燕[1] 刘克成[1] 朱颢东[2]
机构地区:[1]南阳理工学院计算机科学与技术系,河南南阳473004 [2]郑州轻工业学院计算机与通信工程学院,郑州450002
出 处:《计算机应用研究》2012年第6期2135-2137,共3页Application Research of Computers
基 金:河南省教育厅自然科学研究指导计划项目(2010C520007)
摘 要:最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不足,将集合论引入倒排表以对其进行改进,然后以此为基础提出了几个命题和推论,并结合最小支持度阈值动态调整策略,提出了一个基于改进的倒排表和集合理论的最频繁项集挖掘算法,最后对所提算法进行验证。实验结果表明,所提算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法,即NApriori和IntvMatrix算法都好。Most frequent item sets mining is the focus and the difficulty of text association rules mining,and directly determines the performance of text association rules mining algorithms.Aiming at shortcomings existing in most frequent item sets mining algorithms,this paper improved traditional inverted list,it combined minimum support threshold dynamic adjustment strategy and presented a new most frequent itemset mining algorithm based on improved inverted list and set theory.In addition,it also offered several propositions and deductions which were used to improve the performance of the provided algorithm.Finally,through experiment testing,the provided algorithm is better in effective rate of rules and time performance than NApriori and IntvMatrix which are two frequently-used most frequent itemsets mining algorithms.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222