检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河海大学计算机与信息工程学院,江苏常州213022
出 处:《计算机应用与软件》2005年第9期105-107,共3页Computer Applications and Software
摘 要:给出了基于距离的异常数据的数量化定义,提出了基于距离的多指标的异常数据挖掘算法,这种算法适合于一般的海量数据库中的数据分析,以学生考试成绩作为实例进行了分析,可以从中动态地挖掘异常数据。作为特例,把单指标的异常数据挖掘算法应用于校园网Web服务器日志文件,给出了上网用户的频率分析图。The quantitative definition of outlier data based on the distance was presented. The multi-criterion algorithm for mining outlier data based on the distance was also proposed. The proposed algorithm was very fit for data analysis in large database, and was applied to the student score in order to mining dynamic outliers. As for special example, the single-criterion algorithm for mining outlier data based on the distance was applied to the Web service log in campus networks. The frequency analysis chart including outlier data sign was presented.
关 键 词:异常数据挖掘 WEB日志 学生成绩 上网行为模式 数据挖掘算法 异常数据 距离 应用 WEB服务器 海量数据库
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] O212.1[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222