HBase,
1.HBase是一个分布式的面向列的开源数据库。
2.结构化数据 可以使用关系行数据库来表示和存储
非结构化数据 就是没有固定结构的数据
半结构化数据 可以通过灵活的键值调整获取相应的信息 且数据的格式不固定。
3.nosql 数据库的产生户数为了解决大规模数据的集合,多重数据种类带来的挑战 尤其是大数据应用难题。
4.常见的关系型数据库 db2 orcle mysql sqlserver
非关系型数据库 HB阿瑟 MongoDb redis
5.HBase的作用:存储大量结果集数据,并提供低延迟的随机查询
6.HBase与hive的区别?
Hive的定位是数据长款工具,虽然也有增删改,但是它增删改对应的是整张表而不是单行数据,查询的延迟较高。
HBase的定位是hadoop的数据库,是一个典型的nosql,所以HBase是迎来在大量数据中进行低延迟的随机查询。
7.行键的设计原则
唯一原则 长度原则 散列原则
8:HFile 是HBase使用的底层存储格式 HFile 对应于列族, 一个列族可以有多个HFile,但是一个HFile不能存储对个列族的数据
9.HBase 扩展和负载均衡的基本单位是 region 。region 本质上是以行键排序的连续存储的区间。如果region太大,系统就会把他们动态拆分,相反的 就把region 合并 以减少存储文件数据
10:HBase在读操作上使用LRU缓存技术,这种缓存也叫做blockcache. blockcache 里面保存的是从HFile里读入内存的斌犯访问的数据,避免硬盘读,每个列族都有blockcache中的block是HBase从硬盘完成一次读取的数据单位
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。