检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:闫佳和 李红辉[1] 马英[2] 刘真[1] 张大林 江周娴 段宇航 YAN Jiahe;LI Honghui;MA Ying;LIU Zhen;ZHANG Dalin;JIANG Zhouxian;DUAN Yuhang(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China;National Information Center,Beijing 100045,China;School of Software,Beijing Jiaotong University,Beijing 100044,China)
机构地区:[1]北京交通大学计算机与信息技术学院,北京100044 [2]国家信息中心,北京100045 [3]北京交通大学软件学院,北京100044
出 处:《计算机科学》2024年第2期1-14,共14页Computer Science
基 金:国家重点研发计划(2019YFB2102500)。
摘 要:随着信息技术的飞速发展,各级政府和大型企业掌握的数据量正在以指数级别增长。然而,数据来源多样会导致格式差异,数据质量参差不齐会影响应用效果,数据分散管理会弱化关联汇集,数据形态异构会造成语义鸿沟。在此背景下,多源异构数据融合负责将来源不同的多模态数据进行有效整合,完成数据互补与关联,进而实现信息增强。目前,大多数已有研究的关注重点集中在大数据治理流程与多模态深度学习,很少有工作研究讨论完整的多源异构数据融合技术框架。因此,在综述关键技术的基础上,文中提出了一整套涵盖“数据引接-数据清洗-数据集成-数据融合”全过程的多源异构数据融合关键技术框架,并对各个环节需要解决的问题与重点任务进行介绍。然后,通过一个政务应用实例场景,给出了政务大数据治理体系的设计,以解决政务数据来源广泛、质量参差不齐、管理分散、形态异构的问题,并进一步阐述了多源异构数据融合的重要价值。最后总结全文并展望未来。With the rapid development of information technology,the data held by governments and enterprises are growing exponentially.However,the multi-source of data will lead to different formats,the low quality of data will affect the application results,the decentralized management of data will weaken integration services,and the heterogeneous modal of data will cause semantic gaps.Under this background,multi-source heterogeneous data fusion is responsible for effectively integrating multi-modal data from different sources,and then achieve information complementarity and data association,thus realizing information enhancement.At present,most studies focus on big data governance process and multi-modal deep learning,there are few works discuss integral multi-source heterogeneous data fusion framework.Therefore,based on reviewing the key technologies,this paper proposes the key technologies framework of multi-source heterogeneous data fusion that covering the processes of“data collection-data cleaning-data integration-data fusion”,and introduces the problems and tasks of each stage.Then,through an example of the government affairs application,the data governance system for government data is designed,which further explains the signi-ficance of multi-source heterogeneous data fusion.In the end,this paper is summarized and future work is prospected.
关 键 词:多源异构数据 多模态数据融合 数据治理技术 政务大数据 大数据治理流程
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229