一种时序数据模式演化的跟踪与查询方法  被引量:4

Tracking and Querying over Timeseries Data with Schema Evolution

在线阅读下载全文

作  者:赵鑫 万英格 刘英博[1,2] Zhao Xin;Wan Yingge;Liu Yingbo(School of Software,Tsinghua University,Beijing 100084;Beijing Key Laboratory of Industrial Bigdata System and Application(Tsinghua University),Beijing 100084)

机构地区:[1]清华大学软件学院,北京100084 [2]工业大数据系统与应用北京市重点实验室(清华大学),北京100084

出  处:《计算机研究与发展》2022年第9期1869-1886,共18页Journal of Computer Research and Development

基  金:国家重点研发计划项目(2019YFB1707402);国家自然科学基金项目(62021002);工信部融合应用软件项目(CEIEC-2020-ZM02-013206)。

摘  要:在物联网与大数据应用蓬勃发展的背景下,各类感知设备产生海量的时序数据,设备管理软件版本的快速迭代导致时序数据的模式演化问题日益凸显.模式演化要求对数据模式进行版本管理,使数据进行模式变更时不产生信息损失,且支持对数据跨模式版本进行读写操作.结合流行的时序数据库管理系统,调研总结了各类数据库管理系统对模式演化的支持情况,对时序数据及其模式进行了形式化表述,对其模式演化的过程进行了分析,设计了一种面向时序数据的模式演化跟踪及查询方法,形式化表达了模式跟踪及跨模式版本查询的整体框架与关键步骤,并在时序数据库Apache IoTDB上进行了实现与测试.最后,分析了实现系统的性能,并展望了未来研究方向.In the context of the Internet of things and big data,vast amount of sensors generate massive time series data on daily basis.The fast iterations of software releases lead to frequent changes to the schema of these time series,which makes the management of schema evolution of time series increasingly prominent.Schema evolution requires the management of each version of data schema,so that there is no information loss during schema modification,and data can be accessed across multiple schema versions.Existing timeseries databases management system have limited support for schema evolution,while schema evolution may occur frequently under this circumstance.State-of-art research and technology for schema evolution mainly focus on relational database,struggling with complicated integrity constraint which is more flexible within timeseries database.This paper compares various databases with regard to schema evolution,provide a formal definition to the time series and its schemas,and analyzes the process of schema evolution.This paper designs a data-centric schema evolution tracing and querying system,discusses the key problems of schema tracking and cross schema version query in detail,and implements and tests it on the timeseries database Apache IoTDB.Finally,the performance of the system is evaluated,and the future research is discussed.

关 键 词:时序数据库 时序数据 模式演化 多模式版本数据 查询重写 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象