检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴裔 郭棋林 陈颢天 郭乃网 WU Yi;GUO Qi-lin;CHEN Hao-tian;GUO Nai-wang(State Grid Shanghai Municipal Electric Power Company, Shanghai 200122, China;School of Economics, Fudan University, Shanghai 200433, China)
机构地区:[1]国网上海电力公司,上海200122 [2]复旦大学计算机科学与技术学院,上海200433
出 处:《哈尔滨理工大学学报》2021年第6期81-86,共6页Journal of Harbin University of Science and Technology
基 金:国家重点研发计划项目(2017YFC0803700);上海市科委科研计划项目(19DZ2252800);国家电网公司科技项目(52094016000A);国网上海市电力公司科技项目(52094020001A).
摘 要:时间序列的研究已经被应用到越来越多的领域中。越来越多的领域应用需要索引和分析海量的时间序列,代表性的比如金融,电力,生物信息等等。这类应用往往面临数以亿计的时间序列的处理,然后从中识别出一些隐藏的模式来。然而目前对时间序列的索引技术都是单机版本,需要用漫长的时间来对大量的时间序列进行索引,限制了时间序列分析的产出率。提出了一种基于Isax表达的分布式时间序列索引算法,并在Spark分布式计算框架下实现算法。首先,给出了基于Isax的分布式索引算法的朴素实现想法,指明了其存在的问题。然后提出一种先建立索引结构,再将时间序列哈希到相应叶子节点的分布式索引算法。最终,构建了一个完整的电力时间序列的近邻近似查询系统,再保证查询精确率的前提下大大提高了计算效率。并在实验数据集上证明了算法的正确性、高效性和可扩展性。Time series research has been applied to more and more areas.More and more domain applications need to index and analyze massive time series,such as finance,electricity,bioinformatics,and so on.Such applications are often faced with hundreds of millions of time series of processing,and then identify some hidden pattern from the model.Firstly,we give a simple idea of the distributed indexing algorithm based on Isax,which points out its existing problems.Then we propose a distributed indexing algorithm to establish the index structure and then insert the time series to the corresponding leaf node.Finally,this paper constructs a complete approximation query system of power time series,and greatly improves the computational efficiency under the premise of ensuring the accuracy of query.The correctness,efficiency and expansibility of the algorithm are proved on the experimental data set.
分 类 号:TP392[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49