基于距离的异常数据挖掘算法及其应用  被引量:12

ALGORITHMS FOR MINING DISTANCE-BASED OUTLIER AND ITS APPLICATION

在线阅读下载全文

作  者:赵泽茂[1] 何坤金[1] 胡友进[1] 

机构地区:[1]河海大学计算机与信息工程学院,江苏常州213022

出  处:《计算机应用与软件》2005年第9期105-107,共3页Computer Applications and Software

摘  要:给出了基于距离的异常数据的数量化定义,提出了基于距离的多指标的异常数据挖掘算法,这种算法适合于一般的海量数据库中的数据分析,以学生考试成绩作为实例进行了分析,可以从中动态地挖掘异常数据。作为特例,把单指标的异常数据挖掘算法应用于校园网Web服务器日志文件,给出了上网用户的频率分析图。The quantitative definition of outlier data based on the distance was presented. The multi-criterion algorithm for mining outlier data based on the distance was also proposed. The proposed algorithm was very fit for data analysis in large database, and was applied to the student score in order to mining dynamic outliers. As for special example, the single-criterion algorithm for mining outlier data based on the distance was applied to the Web service log in campus networks. The frequency analysis chart including outlier data sign was presented.

关 键 词:异常数据挖掘 WEB日志 学生成绩 上网行为模式 数据挖掘算法 异常数据 距离 应用 WEB服务器 海量数据库 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] O212.1[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象