基于统计的离群数据挖掘与分析  被引量:3

Statistics-based Outlier Mining and Analysis

在线阅读下载全文

作  者:金义富[1] 邓明[1] 

机构地区:[1]湛江师范学院信息科学与技术学院,广东湛江524048

出  处:《湛江师范学院学报》2007年第6期70-73,共4页Journal of Zhanjiang Normal College

基  金:重庆市自然科学基金(2005BB2224);湛江师范学院科研基金(L0614)

摘  要:在数据空间中不可避免地存在着一些严重偏离整体样本集合的其它观测值,这些离群数据对数据挖掘与分析结果具有重要影响.通过对各种基于统计算法的总结与比较。按一元到多元的探索性离群分析思路.设计了一般分布下的 Grubbs 离群检测法和基于似然的混合模型离群点检测方法,并对多维数据的统计检测技术进行了讨论.结果表明,在离群检测与分析中恰当地利用统计方法在低维数据中的有效性进行探索性数据分析是可行的.Some observations deviate so much from other observations in a set of data as to influence the results of data mining and analysis inevitably in data space.Summarizing and compared statistics-based outlier mining algorithms,this paper designs Grubbs outlier detecting method and the likelihood-based mix model outlier mining method in general distribution based on exploratory outlying analysis.The statistic mining method for multi-dimensional data set is also discussed.Results show that exploratory data analysis for outliers by means of efficiency of statistic method in low-dimension data space is feasible.

关 键 词:离群数据 统计模型 挖掘 分析 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象