基于序列聚类的事件流数据特征分析  被引量:2

Characteristics Analysis of Event Stream Data Based on Sequence Clustering

在线阅读下载全文

作  者:王勇[1] 王洁[2] 王明华[3] 焦丽梅[1] 

机构地区:[1]国家智能计算机研究开发中心中国科学院计算技术研究所 [2]首都师范大学信息工程学院,北京100037 [3]国家计算机网络应急技术处理协调中心,北京100029

出  处:《计算机工程》2008年第12期34-36,共3页Computer Engineering

基  金:国家发改委CNGI基金资助项目(CNGI-04-7-1D)

摘  要:事件流是近年来兴起的一种对实时进入系统的海量数据进行分析查询的应用,而数据特征是评价系统所需要的负载模型的重要部分。以网络安全监控为背景,提出一种将事件流聚集成时间序列并进行相似性聚类来分析数据特征的方法。通过适当的粒度聚合,将事件流转化成时间序列,选取周期性的时间序列作为代表消除随机干扰,给出基于序列线性相似性的聚类算法。聚类试验表明,具有相似时间特征的事件流可以被有效地聚集到同一类中。Event stream is a new kind of analysis application on massive data which enter the system in real-time and data characteristics are important components of workload modeling to evaluate specific system.With background on network security monitoring,it presents an approach of aggregating event stream into time series and charactering data using similarity clustering.Event streams are converted into time series by aggregation of moderate granularity of time,and,the seasonal component of time series is chosen as the representation of original series to avoid random noise.Clustering algorithm of similarity under the transformation of scaling and shifting is presented.Experiment on real data shows that event streams with similar temporal characteristics are clustered into the same cluster efficiently.

关 键 词:数据特征 时间序列 聚类 事件流 

分 类 号:TN911.72[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象