欢迎投稿

今日深度:

Hive与HBase,

Hive与HBase,


什么是Hive:

Hive实际上是一款开源的数据仓库,它是建立在Hadoop基础设施之上的,底层文件系统是HDFS。

什么是HBase:

HBase是一种键值系统的数据库,nosql数据库之一,基于列式存储。它也是基于HDFS。

两者区别:

通过定义就可以清楚知道,Hive是数据仓库,HBase是数据库,两者是有着很大区别的,如:

Hive适合海量数据的挖掘和分析,不支持更新、索引等事务。通过Hive可以使用HQL语言对存放在HDFS文件系统上的数据进行结构化操作。Hive的计算引擎是Hadoop的MapReduce。而HBase适合海量半结构化带时间序列的数据的存储和检索,也就是HBase支持更新、索引等事务。Hbase能够实时运行,其计算引擎由自身提供。

Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目 。

Hive的计算速度比较慢,HBase则具有高效的性能。

Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。HBase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作

www.htsjk.Com true http://www.htsjk.com/hbase/42507.html NewsArticle Hive与HBase, 什么是Hive: Hive实际上是一款开源的数据仓库,它是建立在Hadoop 基础设施之上的,底层文件系统是HDFS。 什么是HBase: HBase 是一种键值系统的数据库,nosql数据库之一,基于...
相关文章
    暂无相关文章
评论暂时关闭