检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:龙立熹 罗洪元[1,2,3] 刘智朋[1,2]
机构地区:[1]华北计算技术研究所 [2]国家电子计算机质量监督检验中心,北京100083 [3]中国计算机学会(CCF)
出 处:《信息技术与信息化》2014年第12期117-121,共5页Information Technology and Informatization
摘 要:由于数据仓库中的ETL任务在执行过程中,需要同时考虑他们之间的执行顺序和依赖关系,因此如何高效地调度管理这些任务是提高数据仓库效率的一个重要问题。本文通过研究现有的ETL工具和调度算法的优缺点,设计和实现了一种基于依赖关系和时间的混合调度算法,并采用此调度算法实现了一个基于数据仓库的工作流系统,最终通过一组真实的数据证明该工作流系统能完成具体的功能任务,并能保证数据仓库中数据的实时性、正确性和一致性。The execution sequence and dependency should be considered when the ETL tasks of data warehouse in the implementation process, so how to efficiently manage the scheduling of these tasks is an important issue to improve the efficiency of the data warehouse. In this paper, through studying the advantages and disadvantages of existing ETL tools and scheduling algorithm, designs and implements a hybrid scheduling algorithm based on dependency and time, and implements a work flow system of data warehouse based on this hybrid algorithm. Finally, through a set of real data to prove the workflow system can perform specific functional tasks, and to ensure the data of data warehouse in real-time, accuracy and consistency.
关 键 词:ETL 数据仓库 依赖关系 有向无环图 并发控制
分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.90