检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与应用》2004年第11期191-194,共4页Computer Engineering and Applications
基 金:国家自然科学基金(编号:60172037)
摘 要:在错误数据集中进行知识发现是当前数据挖掘研究中的一个热点问题。以往的算法往往需要大量的先验知识或假设,同时会造成数据浪费。该文在总结以往对于错误数据预处理的一般方法的基础上,对关系型数据库常见错误类型进行了分析,提出利用数据可能性构建模糊数据库的方法对数据预处理过程中的可疑数据进行处理,并比较了该种算法与传统算法之间的优缺点。可以看出,该文的算法较好地解决了先验知识缺乏和数据浪费等问题,利用模糊化的方法来对数据库中的可疑数据进行处理是一个十分有价值的研究方向。Disc ov ering knowledge in dataset that exists mistakes is a focus of recent data minin g study.In the past algorithms ,prior knowledge or hypothesis is often needed and the data information will be wasted.On the basis of surveying the past prep rocess algorithms ,this paper analyzes the common mistakes in relation database ,develop s a method that deals with the suspicious data in preprocess by constr ucting a fuzzy database based on the possibilities between data and compares it with the past algorithms.It shows that the algorithm can handle shorting of pr ior knowledge and data wasting effectively.Fuzzy approach is a meaningful dire ction to deal with the suspicious data in database.
关 键 词:数据挖掘 不完美数据集 关系型数据库 模糊数据库
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.151