欢迎投稿

今日深度:

[原理]HBase,

[原理]HBase,


HBase高性能复杂条件查询引擎 - 远方的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/u014774781/article/details/52397120
——索引的实质是另一种编排形式的数据冗余,高效的检索源自于面向查询特别设计的编排形式,如果再辅以分布式的计算框架,就可以支撑起高性能的大数据查询

HBase技术介绍 « 搜索技术博客-淘宝
http://www.searchtb.com/2011/01/understanding-hbase.html
HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

Hadoop EcoSystem中的各层系统.png

上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。

HBase系统架构.png

Client
HBase Client使用HBase的RPC机制与HMaster和HRegionServer进行通信,对于管理类操作,Client与HMaster进行RPC;对于数据读写类操作,Client与HRegionServer进行RPC

HBase存储格式
HBase中的所有数据文件都存储在Hadoop HDFS文件系统上,主要包括上述提出的两种文件类型:

www.htsjk.Com true http://www.htsjk.com/hbase/40785.html NewsArticle [原理]HBase, HBase高性能复杂条件查询引擎 - 远方的专栏 - 博客频道 - CSDN.NET http://blog.csdn.net/u014774781/article/details/52397120 —— 索引的实质是另一种编排形式的数据冗余,高效的检索源自...
相关文章
    暂无相关文章
评论暂时关闭