检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周欣[1] 沙朝锋[1] 朱扬勇[1] 施伯乐[1]
出 处:《计算机研究与发展》2000年第5期627-633,共7页Journal of Computer Research and Development
基 金:国家自然科学基金和国家"八六三"高技术研究发展计划基金资助!(项目编号 863 -3 0 6-ZT0 2 -0 5 -1)
摘 要:关联规则的采掘是数据采掘研究的一个重要方面 .分析现有的关联规则采掘算法中所存在的问题 :首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响 ,因而导致知识表达功能的不够完善 ;其次是有可能一条规则即使可信度和支持度都很高 ,仍没有实际意义 ,甚至是误导性的 .因此对关联规则的形式定义作了修改 ,将运用差异思想引入的兴趣度阈值运用到关联规则中来 ,并给出其形式定义 .在分析了兴趣度的实际意义以后 ,讨论了兴趣度与概念层次的结合 .Mining the association rules is an important aspect of the study of data mining. This paper analyzes some problems existing in those available association rules mining algorithms. Firstly, association rules neglect the effect of all kinds of potential negative examples, which results in imperfection in their expressive ability; secondly, it is probable that a rule will have no practical significance or even be misleading even if it possesses high confidence and support. The paper revises the formal definition of association rules, makes use of the deviation based interest value presented in association rules, and defines it in form. In addition to analyzing the practical significance of the interest value, the combination of the interest value and concept hierarchy are also discussed.
关 键 词:数据采掘 关联规则 兴趣度 概念层次 阈值 数据
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15