双层聚类模型在日志数据分析中的应用  被引量:1

The Application of Double Layer Clustering Model on Log Data Analysis

在线阅读下载全文

作  者:古恒[1,2] 陈钊[3] 王枞[2,4] 张思悦[2,4] 傅群超 

机构地区:[1]北京邮电大学计算机学院,北京100876 [2]北京邮电大学可信分布式计算与服务教育部重点实验室,北京100876 [3]北京市政务信息安全应急处置中心,北京100101 [4]北京邮电大学软件学院,北京100876

出  处:《北京邮电大学学报》2015年第B06期63-66,71,共5页Journal of Beijing University of Posts and Telecommunications

基  金:北京市科委项目(Z131100001113034)

摘  要:提出了一种基于自组织特征映射(SOM)神经网络和模糊c-均值(FCM)的双层聚类方法,对Web日志中的日志数据集进行聚类.第一层是无监督SOM神经网络聚类方法,它所产生的类的个数大大减少了原始数据集的个数,降低了FCM对类初始中心点的依赖;然后利用FCM聚类算法的优势对第一层中产生的类的中心点进行聚类,从而大大减少了聚类的时间复杂度;最后通过平行坐标技术可视化展示聚类前后的日志数据集,方便对日志数据进行分析.A double clustering model to make web log data sets clustering was proposed based on the self- organizing map (SOM) neural networks and the fuzzy c-means (FCM) method. The first tier uses unsu- pervised clustering method--SOM neural network, so the number of classes it generates significantly re- duces compared with the original data set, it also reduces the FCM method' s rely on class initial centers. Using the FCM clustering algorithm to cluster the center points of classes generated by the first layer, the time complexity of clustering is greatly reduced. Meanwhile, the parallel coordinates visualization tech- nology to demonstrate the log dataset was used, it is suitable to analyze the log data.

关 键 词:平行坐标 日志数据 聚类 自组织特征映射 模糊C-均值 

分 类 号:TN929.53[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象