面向数据发布的科学工作流数据溯源方法研究  被引量:7

Study on the Method of Provenance in Science Workflow for Data Publishing

在线阅读下载全文

作  者:邓仲华[1] 魏银珍[1] 

机构地区:[1]武汉大学信息管理学院,湖北武汉430074

出  处:《图书与情报》2014年第3期61-66,共6页Library & Information

基  金:国家自然科学基金项目"大数据环境下面向科学研究第四范式的信息资源云研究"(批准号:71373191)与国家自然科学基金项目"云计算环境下图书馆的信息服务等级协议研究"(批准号:71173163)研究成果之一

摘  要:越来越多的科学家使用工作流系统设计和运行科学实验。工作流执行的结果数据集可能需要与报告或论文一起发布,以为其他科学实验的输入重复使用。此时,数据的正确性需要被验证,要求科学家在发布数据的同时发布其溯源元数据,包括数据的演变历史、起源和所有权。为协助科学家完成这一任务,文章建立了一个工作流实例,在此基础上,探讨工作流管理系统运行时溯源信息的收集,指出原始溯源信息在支持数据发布任务时的缺陷,提出了一种提纯溯源的方法来获得适合于数据发布任务的溯源信息。More and more scientists use workflow system to design and operate scientific experiments. Workflow execution result data set may need to be published with the report or thesis, as the input of other scientific experiments reused. In this case, the accuracy of the data needs to be validated, requiting scientists released data with its provenance metadata, including the derivate historical, origin and ownership. To help scientists to accomplish this task, we establish a workflow instance, to illustrate how provenance is collected while workflow management system running, pointing out the shortage of raw provenance information in data publishing tasks, also, we propose a purification provenance methods to obtain suitable and informative provenance to the data publishing task.

关 键 词:科学工作流 提纯 溯源 数据发布 

分 类 号:G202[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象