基于云计算的景区数据仓库应用研究  被引量:4

Research on Data Warehouse Application of Tourist Areas Data Based on Cloud Computing

在线阅读下载全文

作  者:谢福伟[1,2] 梁昌勇[1,2] 马银超[1,2] 

机构地区:[1]合肥工业大学管理学院,安徽合肥230009 [2]过程优化与智能决策教育部重点实验室,安徽合肥230009

出  处:《计算机技术与发展》2014年第9期198-201,205,共5页Computer Technology and Development

基  金:国家自然科学基金重点项目(71331002);智慧景区客流量预测系统项目(10120106011)

摘  要:云计算、物联网、大数据等新兴信息技术的发展与应用在提高景区信息化服务水平的同时,也对景区海量信息资源的有效利用提出了严峻挑战。面对超大规模、非结构化的海量数据,传统的基于关系型数据库的数据仓库已很难有效支持景区的数据存储与分析工作。基于此文中提出了一种基于云计算技术的景区数据仓库,通过采用HDFS对数据进行分布式存储管理,利用MapReduce设计海量数据的分析模式,使用HiveQL语言实现数据仓库与前端表现层的交互,能够有效解决景区海量数据的数据管理问题。以黄山风景区为实际背景的实验结果表明了该数据仓库的正确性和有效性。The emergence of new information technologies, such as cloud computing, internet of things, big data, etc, greatly enhances the level of area of information technology services. However, how to effectively utilize the scenic area of information resources is a great challenge. Faced large scale and unstructured mass data, the data warehouse based on the traditional relational database has been difficult to effectively support the data storage and analysis in scenic area. Based on this, propose a scenic area data warehouse based on cloud computing technology, adopting HDFS for distributed storage of data, using MapReduce to design massive data analysis model, with HiveQL language to implement the interaction between data warehouse and front-end presentation layer, which can solve the data management problem of massive data in scenic area. Taking Huangshan as example, the experimental results indicate the data warehouse is correct and feasible.

关 键 词:云计算 数据仓库 MAPREDUCE ETL 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象