基于回归的多层数据立方体中的异常发现算法  

Regression-based exceptions finding algorithm in multi-level data cube

在线阅读下载全文

作  者:胡孔法[1] 丁有伟[1] 陈崚[1] 宋爱波[2] 

机构地区:[1]扬州大学信息工程学院,江苏扬州225009 [2]东南大学计算机科学与工程学院,江苏南京210096

出  处:《计算机集成制造系统》2009年第12期2481-2486,共6页Computer Integrated Manufacturing Systems

基  金:国家自然科学基金资助项目(60773103,60673060);江苏省自然科学基金资助项目(BK2009697,BK2008206);江苏省教育厅自然科学基金资助项目(08KJB520012);江苏省“六大人才高峰”基金资助项目;江苏省“青蓝工程”基金资助项目。~~

摘  要:为了快速有效地挖掘数据立方体中的数据,提出了阈值异常和区间异常两种基于回归分析的异常发现方法,根据回归系数帮助用户快速地找出数据单元内的异常数据。阈值异常方法通过比较数据的规格化残差和用户给定的偏差阈值来发现异常数据。区间异常方法通过比较数据点的残差绝对值和置信区间来发现异常数据。最后,对这些算法的性能进行了分析,理论分析和实验结果验证了这两种算法的有效性。To mine data in data cube rapidly and effectively,two exception finding algorithms based on regression analysis were proposed,which used threshold and confidence interval respectively.By regression coefficient,users could find the exceptions in the data cells quickly.Data was considered as an exception by comparing its normal residual to the user's specified threshold in the process of threshold exception,while comparing the Absolute value of residual to the confidence interval in the process of interval exception.Performances of these two algorithms were analyzed,and their validity efficiency were verified by experiment.

关 键 词:数据挖掘 数据立方体 回归分析 异常发现 阈值 置信区间 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象