非同步多时间序列中频繁模式的发现算法  被引量:8

An Algorithm for Discovering Frequent Patterns in Non-Synchronous MultipleTime Series

在线阅读下载全文

作  者:李斌[1] 谭立湘[1] 解光军[1] 李海鹰[1] 庄镇泉[1] 

机构地区:[1]中国科学技术大学电子科学与技术系,安徽合肥230026

出  处:《软件学报》2002年第3期410-416,共7页Journal of Software

基  金:国家重点基础研究发展规划973资助项目(G1998030413);国家教育部博士点基金资助项目(1999035808)~~

摘  要:从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法.该算法首先利用线性化分段表示法和矢量形态聚类实现时间序列的特征分割与符号化转换,然后通过将Agrawal关联模式发现算法的核心思想与时间序列最短实现表示方法相结合,实现了非同步多时间序列中多种结构频繁模式的发掘.与已有算法相比,该算法更简单、更灵活,并且不要求序列严格同步.实验结果证明了该算法的有效性.Discovering frequent patterns in multiple time series is important in practices. Methods appeared in literatures assume that the multiple time series are synchronous, but in the real world, that is not always satisfied, in most cases they are non-synchronous. In this paper, an algorithm for discovering frequent patterns in non-synchronous multiple time series is proposed. In this algorithm, first, the time series is segmented and symbolized with the linear segment representation and the vector shape clustering method, so that each symbol can represent a primitive and independent pattern. Then, the minimal occurrence representation of time series and the association rule discovery algorithm proposed by Agrawal is combined to extract frequent patterns of various structures from non-synchronous multiple time series. Compared with the previous methods, the algorithm is more simple and flexible, and does not require time series to be synchronous. Experimental results show the efficiency of thealgorithm.

关 键 词:数据挖掘 频繁模式 符号化 多同步多时间序列 算法 数据库 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象