检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京邮电大学通信与信息工程学院,江苏南京210003
出 处:《南京邮电大学学报(自然科学版)》2014年第1期111-115,共5页Journal of Nanjing University of Posts and Telecommunications:Natural Science Edition
摘 要:Hadoop利用统一的备份机制来确保数据的可用性和容错性。然而对于重要的文件块,只能通过修改配置文件来设置副本数量。通过分析电信业数据仓库文件的访问情况,提出文件备份与存放动态调整算法(BPDA)来提高数据局部性,以减少数据传输带来的I/O和网络消耗,提高查询效率。运用多副本一致性哈希算法,概率采样和竞争力弱化算法,得到每一个文件的最佳备份数和备份位置。实验结果验证了该算法可以提高查询关联效率。Hadoop uses a uniform data replication scheme to ensure data availability and fault tolerance.For an important data block,the number of replicates can only be set by modifying the configuration file.Through the analysis of file access of telecom data warehouse,a file replicate and location dynamic adjustment algorithm,called the BPDA is proposed to improve the data locality,thus it reduces the I/O and network overhead due to data transmission,and enhances the efficiency of query processing.Using multi-copy consistency Hash algorithm,probability sampling and competitive aging algorithm,the optimized number and the storage location are achieved for each file.Experimental results show that BPDA can improve the efficiency of join query processing.
关 键 词:HADOOP MAPREDUCE 备份 关联查询处理
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.210.110