BigFlow:科学数据跨中心协同分析服务系统  

BigFlow:A service system for cross-center collaborative analysis of scientific data

在线阅读下载全文

作  者:朱小杰[1,2] 程振京 王华进 杨刚 田尧 樊东卫 米琳莹[3] 梁兆基[1,2] ZHU Xiaojie;CHENG Zhenjing;WANG Huajin;YANG Gang;TIAN Yao;FAN Dongwei;MI Linying;LIANG Zhaoji(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100083;University of Chinese Academy of Sciences,Beijing 100049;National Astronomical Observatories,Chinese Academy of Sciences,Beijing 100101,China)

机构地区:[1]中国科学院计算机网络信息中心,北京100083 [2]中国科学院大学,北京100049 [3]中国科学院国家天文台,北京100101

出  处:《计算机工程与科学》2025年第4期706-717,共12页Computer Engineering & Science

基  金:国家重点研发计划(2021YFF0703900);中国科学院“十四五”网信专项工程建设项目“科学大数据工程(三期)”(CAS-WX2022GC-02);国家自然科学基金(12273077)。

摘  要:大数据技术与科学数据的融合催生了诸多科学研究的新范式,也带来了对科学数据进行跨中心协同分析的广泛需求。科学数据跨中心协同分析面临跨中心数据流转不畅、跨框架异构计算困难和跨中心作业调度效率不高等技术挑战,同时要确保分析过程的可信性。为应对这些技术挑战,研制了科学数据跨中心协同分析服务系统BigFlow,该系统采用跨中心分布式架构,配备跨框架工作流执行引擎,实现了工作流跨域的可信执行。基于大规模天文星表交叉证认及黄河流域淤地坝位置识别等应用场景,对系统的跨中心协同分析能力进行了测试与验证。The integration of big data technology and scientific data has spawned numerous new paradigms for scientific research and brought about a widespread need for cross-center collaborative analysis of scientific data.However,such analysis faces significant technical challenges,including inefficient cross-center data transfer,difficulties in cross-framework heterogeneous computing,and low efficiency in cross-center job scheduling,while also requiring trustworthiness throughout the analysis process.To address these technological challenges,a scientific data cross-center collaborative analysis service system called BigFlow has been developed.The system's cross-center collaborative analysis capabilities have been tested and validated based on scenarios such as large-scale astronomical star catalog cross-matching and the identification of check dam locations in the Yellow River basin.

关 键 词:融合分析 跨中心协同分析 跨框架工作流 可信分析 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象