检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南工业大学计算机与通信学院,湖南株洲412000
出 处:《计算技术与自动化》2015年第2期100-103,共4页Computing Technology and Automation
基 金:科技部科技支撑计划课题项目(2013BAJ10B14-5);湖南省自然科学基金面上课题项目(14JJ2115);湖南省教育厅科研重点项目(14A037)
摘 要:随着互联网发展带来的数据爆炸,使得Web日志的数据量也越来越大,如何从海量的Web日志中挖掘有价值的信息成为了目前研究的热点。本文提出基于Hadoop集群框架对Web日志进行挖掘。实验结果表明,该集群系统既可以处理海量的web日志,同时也能够挖掘出有价值的信息,并证实了利用sqoop在Hive仓库和传统数据库之间数据迁移的可行性。The rapid development of Internet brings data explosion,so web log data is becoming bigger and bigger.How to mine valuable information from huge amounts of Web log becomes the focus of present study.This paper presented Web log mining based on the Hadoop cluster framework.Experimental results show that this cluster system can process massive web log data,and can mine valuable information.And it is confirmed to be feasible that the data migrates between Hive warehouse and traditional database by using sqoop.
关 键 词:WEB日志 HADOOP Sqoop Hive 数据迁移
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7