欢迎投稿

今日深度:

HBase,

HBase,


1.HBase是一个分布式的面向列的开源数据库。
2.结构化数据 可以使用关系行数据库来表示和存储
非结构化数据 就是没有固定结构的数据
半结构化数据 可以通过灵活的键值调整获取相应的信息 且数据的格式不固定。
3.nosql 数据库的产生户数为了解决大规模数据的集合,多重数据种类带来的挑战 尤其是大数据应用难题。
4.常见的关系型数据库 db2 orcle mysql sqlserver
非关系型数据库 HB阿瑟 MongoDb redis
5.HBase的作用:存储大量结果集数据,并提供低延迟的随机查询
6.HBase与hive的区别?
Hive的定位是数据长款工具,虽然也有增删改,但是它增删改对应的是整张表而不是单行数据,查询的延迟较高。
HBase的定位是hadoop的数据库,是一个典型的nosql,所以HBase是迎来在大量数据中进行低延迟的随机查询。
7.行键的设计原则
唯一原则 长度原则 散列原则
8:HFile 是HBase使用的底层存储格式 HFile 对应于列族, 一个列族可以有多个HFile,但是一个HFile不能存储对个列族的数据
9.HBase 扩展和负载均衡的基本单位是 region 。region 本质上是以行键排序的连续存储的区间。如果region太大,系统就会把他们动态拆分,相反的 就把region 合并 以减少存储文件数据
10:HBase在读操作上使用LRU缓存技术,这种缓存也叫做blockcache. blockcache 里面保存的是从HFile里读入内存的斌犯访问的数据,避免硬盘读,每个列族都有blockcache中的block是HBase从硬盘完成一次读取的数据单位

www.htsjk.Com true http://www.htsjk.com/hbase/37662.html NewsArticle HBase, 1.HBase是一个分布式的面向列的开源数据库。 2.结构化数据 可以使用关系行数据库来表示和存储 非结构化数据 就是没有固定结构的数据 半结构化数据 可以通过灵活的键值调整获...
相关文章
    暂无相关文章
评论暂时关闭