基于SAX的时间序列相似性度量方法  被引量:14

Research on similarity measure for time series based on SAX

在线阅读下载全文

作  者:李桂玲[1,2] 王元珍[2] 杨林权[3] 吴湘宁[1] 

机构地区:[1]中国地质大学计算机学院,武汉430074 [2]华中科技大学计算机科学与技术学院,武汉430074 [3]中国地质大学信息工程学院,武汉430074

出  处:《计算机应用研究》2012年第3期893-896,共4页Application Research of Computers

基  金:湖北省自然科学基金资助项目(2009CDB226);中央高校基本科研业务费专项资金资助项目(CUGL100243)

摘  要:符号化表示是一种有效的时间序列降维技术,其相似性度量是诸多挖掘任务的基础。基于SAX(sym-bolic aggregate approximation)的距离MINDIST_PAA_iSAX不满足对称性,在时间序列挖掘中具有局限性,提出了对称的度量Sym_PAA_SAX,且下界于欧拉距离。在真实数据集和合成数据集上的实验说明下界紧密性较好,相似搜索错报率较低。Symbolic approximation is an effective dimensionality reduction technique for time series, its similarity measure is a basis for various mining tasks. MINDIST_PAA_iSAX is a distance function based on symbolic aggregate approximation (SAX), but it does not satisfy symmetry, so it has limitation in mining time series. This paper put forward and proved a symmetric distance measure Sym_PAA_SAX to be lower bounding to Euclidean distance. Experiments on real and synthetic data sets show its better tightness of lower bounding and lower false positives rate in similarity search.

关 键 词:时间序列 降维 相似性度量 下界 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象