面向人口健康领域科研项目数据汇交的数据仓储设计与实现  被引量:14

Data Archive for Research Projects in Population Health

在线阅读下载全文

作  者:吴思竹[1] 钱庆[1] 周伟 钟明[1] 王安然 修晓蕾 苟欢 李赞梅[1] 李姣[1] 方安[1] Wu Sizhu;Qian Qing;Zhou Wei;Zhong Ming;Wang Anran;Xiu Xiaolei;Gou Huan;Li Zanmei;Li Jiao;Fang An(Institute of Medical Information/Medical Library,Chinese Academy of Medical Science&Peking Union Medical College,Beijing 100020,China;National Population Health Data Center,Beijing 100005,China)

机构地区:[1]中国医学科学院/北京协和医学院医学信息研究所/图书馆,北京100020 [2]国家人口健康科学数据中心,北京100005

出  处:《数据分析与知识发现》2020年第12期2-13,共12页Data Analysis and Knowledge Discovery

基  金:国家重点研发计划精准医学研究重点专项课题“重大疾病精准医学数据库群”(项目编号:2016YFC0901602);基地和人才专项科技基础条件平台专项课题“PHDA国际认证与规范化实施”(项目编号:NCMI-KD01N-202006);中国医学科学院医学与健康科技创新工程重大创新项目“人口健康科学数据中心及新冠肺炎相关数据资源整合平台建设”(项目编号:2020-I2M-2-001)的研究成果之一。

摘  要:【目的】为国家财政支持的人口健康领域科研项目数据汇交和管理提供重要基础支撑,重点介绍国家人口健康科学数据中心数据仓储(Population Health Data Archive,PHDA)在科研项目数据汇交方面的功能设计和实施方法。【方法】分析人口健康领域科研项目数据汇交流程特点,构建满足国家财政预算支持的科研项目数据汇交和管理迫切需求的数据仓储,设计形成灵活、可扩展的总体框架和友好易用的功能模块。【结果】PHDA实现项目信息注册、项目数据汇交、大数据高速传输、安全保藏、数据唯一标识分配、分级分类存储、访问控制和凭证发放等功能,已有效支撑国家科技基础性工作专项14个项目,292个数据集的汇交工作。【局限】还需运用数据语义化和深度学习等技术实现增强数据管理、数据语义融合和智能化数据分析服务,优化仓储功能。【结论】PHDA实现人口健康领域科研项目数据汇交管理与共享利用,对国家人口健康领域科学数据的汇聚、积累和安全保障具有重要意义。[Objective] This study focuses on the design and implementation of the Population Health Data Archive(PHDA), aiming to support data curation of research projects supported by the government. [Methods]First, we analyzed the data curation characteristics of research projects on population health. Then, we constructed a data archive for their urgent needs. Our system includes flexible and scalable framework, as well as user friendly functional modules. [Results] The PHDA finished the tasks of project registration, data collection, big data highspeed transmission, security preservation, distribution of unique dataset identifiers, effective storage, access control and voucher issuance. In 2019, our system administrated 292 datasets for 14 projects from the National Special Program on Basic Works for Science and Technology. [Limitations] The PHDA could be optimized with more data semantics and deep learning technologies(i. e., intelligent data analysis services). [Conclusions] The PHDA could effectively curate and disseminate shared research data in the field of national population health.

关 键 词:科研项目 数据汇交 数据管理 人口健康 

分 类 号:G203[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象