检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡孔法[1] 丁有伟[1] 陈崚[1] 宋爱波[2]
机构地区:[1]扬州大学信息工程学院,江苏扬州225009 [2]东南大学计算机科学与工程学院,江苏南京210096
出 处:《计算机集成制造系统》2009年第12期2481-2486,共6页Computer Integrated Manufacturing Systems
基 金:国家自然科学基金资助项目(60773103,60673060);江苏省自然科学基金资助项目(BK2009697,BK2008206);江苏省教育厅自然科学基金资助项目(08KJB520012);江苏省“六大人才高峰”基金资助项目;江苏省“青蓝工程”基金资助项目。~~
摘 要:为了快速有效地挖掘数据立方体中的数据,提出了阈值异常和区间异常两种基于回归分析的异常发现方法,根据回归系数帮助用户快速地找出数据单元内的异常数据。阈值异常方法通过比较数据的规格化残差和用户给定的偏差阈值来发现异常数据。区间异常方法通过比较数据点的残差绝对值和置信区间来发现异常数据。最后,对这些算法的性能进行了分析,理论分析和实验结果验证了这两种算法的有效性。To mine data in data cube rapidly and effectively,two exception finding algorithms based on regression analysis were proposed,which used threshold and confidence interval respectively.By regression coefficient,users could find the exceptions in the data cells quickly.Data was considered as an exception by comparing its normal residual to the user's specified threshold in the process of threshold exception,while comparing the Absolute value of residual to the confidence interval in the process of interval exception.Performances of these two algorithms were analyzed,and their validity efficiency were verified by experiment.
关 键 词:数据挖掘 数据立方体 回归分析 异常发现 阈值 置信区间
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43