Hive简介，

和通数据库htsjk.Com2019-12-28 23:00 来源:未知阅读:8154 评论 183 热度2

标签：

Apache Hive

用户接口：包括 CLI、JDBC/ODBC、WebGUI。其中，CLI(command lineinterface)为 shell 命令行；JDBC/ODBC 是 Hive 的 JAVA 实现，与传统数据库JDBC 类似；WebGUI 是通过浏览器访问 Hive。
元数据存储：通常是存储在关系数据库如 mysql/derby 中。Hive 将元数据存储在数据库中。Hive 中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。
解释器、编译器、优化器、执行器:完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中，并在随后有 MapReduce 调用执行。

Hive 利用 S HDFS 存储数据，利用 e MapReduce 查询分析数据。

hive 用于海量数据的离线数据分析。
hive 具有 sql 数据库的外表，但应用场景完全不同，hive 只适合用来做批量数据统计分析。
更直观的对比请看下面这幅图：

Hive 中所有的数据都存储在 HDFS 中，没有专门的数据存储格式在创建表时指定数据中的分隔符，Hive 就可以映射成功，解析数据。