欢迎投稿

今日深度:

Hive数据存储,

Hive数据存储,


1、Hive中所有的数据包存储在HDFS中,没有专门的数据存储格式(可支持Text,SequenceFile,ParquetFile,RCFile等)

2、只需要在创建表的时候告诉Hive 数据中的列分隔符和行分隔符,Hive就可以解析数据。(不懂hive中数据分割符的可以看我的这一篇:https://blog.csdn.net/S_Running_snail/article/details/84258162)

3、Hive中包含以下数据模型: DB,Table, External Table,Partition,Bucket.     

  • db:在hdfs中表现为S(hive metastore warehouse.dir)目录下一个文件夹
  • table:在hdfs中表现所属db目录下一个文件夹
  • extermal rable:与table类似,不过其数据存放位置可以在任意指定路径
  • partition在hdfs中表现为table目录下的子目录
  • bucket:在hdfs中表现为同一个表目录下根据hash散列之后的多个文件

www.htsjk.Com true http://www.htsjk.com/hive/38086.html NewsArticle Hive数据存储, 1、Hive中所有的数据包存储在HDFS中,没有专门的数据存储格式(可支持Text,SequenceFile,ParquetFile,RCFile等) 2、只需要在创建表的时候告诉Hive 数据中的列分隔符和行分隔...
相关文章
    暂无相关文章
评论暂时关闭