HBase针对移动互联网业务的改进与优化  

HBase Improvements for Online Mobile Services

在线阅读下载全文

作  者:雷军[1,2] 刘绍辉 冯宏华 何炎祥[1,3] 

机构地区:[1]武汉大学计算机学院,武汉430072 [2]小米科技有限责任公司,北京100085 [3]软件工程国家重点实验室(武汉大学),武汉430072

出  处:《小型微型计算机系统》2017年第5期1158-1163,共6页Journal of Chinese Computer Systems

基  金:国家自然科学基金面上项目(61170022)资助;国家自然科学基金重点项目(91118003)资助

摘  要:Apache HBase是当前互联网公司广为使用的开源NoSQL数据库.小米公司几乎所有的在线业务,包括米聊和小米云服务,都使用HBase作后端存储.在海量数据处理应用中,发现HBase的功能存在一定的缺失,在写入吞吐量等性能度量上存在瓶颈.本文针对移动互联网在线业务的特点,基于现有HBase版本提出可保证数据一致性的局部二级索引功能和反向扫描功能,并提出了可配置的细粒度跨集群复制概念,显著提升了单机写吞吐性能.经过全面测试,上述设计和改进方案极大提升了HBase的应用性能,并被部署到了小米的生产集群中.As an increasingly popular open-source database, Apache HBase has been used by the back-end storage system of Xiaomi inc. for almost all the online services such as MiTalk and Mi Cloud. Facing multivariate requirements of mobile Intemet, HBase has exhibited several drawbacks that cannot fully support Xiaomi's business development,such as lacking of secondary index,reverse scan, configurable replication, etc. We therefore developed a series of new features to tackle these problems and moreover, improved the writing performance markedly by introducing a new writing model. All these enhancements have been evaluated through extensive ex- periments before eventually deployed in Xiaomi's production clusters.

关 键 词:HBASE 跨集群复制 反向扫描 跨行事务 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象