欢迎投稿

今日深度:

Hbase笔记,

Hbase笔记,


  • 为什么有hbase?
  • hbase是什么?
  • 适用场景
  • hbase的特点
  • Hbase的架构和Hbase的关键字
  • hbase 安装与基础使用

前言

nosql:hbase、redis、mongodb、
RDBMS:mysql oracle sqlserver db2 access excel 等

1.Hbase 没有事务的支持,hbase存储的数据都是非结构化或者半结构化的数据,而关系型数据库存储的都是结构化数据 
2.事务:以ATM及取钱为例,当取钱取到一半时。机器除了故障,钱没出来,但是账户里的金额减少了,这时就会有事务回滚,恢复到正常金额

1、为什么有hbase?

随着数据量越来越大,传统的关系型数据库不能满足需求。
hive虽然能够满足存储的要求,但是不能满足非结构的、半结构化的数据的存储。
和高效查询。

Hbase的来源:

之前在讲解hadoop的时候 hadoop的诞生源自于谷歌的三大论文:

GFS -------》HDFS

MapReduce -------》 MapReduce

Bigtable -------》 Hbase (hadoop base )

BigTable 背景:爬取网页浏览信息,都是非结构化的数据 如何有效的存储? bigtable的设计思想为
多行三列的大表

Hbase 正是继承了这种思想,开发hbase数据库,是一个面向列,可扩展的,非关系型数据库(no sql 数据库)

非关系型的数据库:

Mongodb: c++编写 基于文档的方式存储,存储格式都是json格式

Redis:基于内存的,key-value的形式 出现的。通过key可以快速的找到value

关系型数据库:

MySQL

Oracle 

Sqlserver

Hbase的解决的问题与诞生背景:

互联网的公司数据一般都是爬取过来的,大量的数据如何存储,并且都是非结构化,传统的数据库不能满足需求了,交通部门的探头,每天拍照的内容,都是图像,不能保存在关系型数据库中

总结: hbase适合存储海量数据,能够将查询速度范围控制在秒的级别,并且hbase是面向列存储的

2、hbase是什么?(译至官网)

hbase是一个开源的、分布式的、多版本的、可扩展的非关系型数据库。
hbase是bigtable的开源java版本。hbase是建立在hdfs之上,
提供高可靠性、高性能、列存储、可伸缩、实时读写的nosql的数据库系统

Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.
Use Apache HBase™ when you need random, realtime read/write access to your Big Data. This project’s goal is the hosting of very large tables – billions of rows X millions of columns – atop clusters of commodity hardware. Apache HBase is an open-source, distributed, versioned, non-relational database modeled after Google’s Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable leverages the distributed data storage provided by the Google File System, Apache HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.

3、适用场景

需要对海量的非结构化的数据进行存储。需要随机的近实时的读写管理数据。

4、hbase的特点(译至官网)

Linear and modular scalability.
Strictly consistent reads and writes.
Automatic and configurable sharding of tables
Automatic failover support between RegionServers.
Convenient base classes for backing Hadoop MapReduce jobs with Apache HBase tables.
Easy to use Java API for client access.
Block cache and Bloom Filters for real-time queries.
Query predicate push down via server side Filters
线性和模块化的可伸缩性。
严格一致的读写。
自动和可配置的表分片
区域服务器之间的自动故障转移支持。
使用Apache HBase表支持Hadoop MapReduce作业的方便基类。
易于使用Java API进行客户机访问。
块缓存和布隆过滤器的实时查询。
查询 叠加通过服务器端的过滤器

5、Hbase的架构和Hbase的关键字

https://blog.csdn.net/murphyZ/article/details/88351442

6、hbase的存储

https://blog.csdn.net/murphyZ/article/details/88351788

7、hbase 安装与基础使用

https://blog.csdn.net/murphyZ/article/details/88345262

www.htsjk.Com true http://www.htsjk.com/hbase/42234.html NewsArticle Hbase笔记, 为什么有hbase? hbase是什么? 适用场景 hbase的特点 Hbase的架构和Hbase的关键字 hbase 安装与基础使用 前言 nosql:hbase、redis、mongodb、RDBMS:mysql oracle sqlserver db2 access excel 等1.H...
相关文章
    暂无相关文章
评论暂时关闭