hadoop 数据存储格式,hadoop数据存储
一般而言,存储格式分为列式存储和行存储,对于hadoop来时,列式存储有parquet,rcfile,orcfile等,行存储有SequenceFile,MapFile,Avro Datafile等
hive中的使用
1.orc
create table test_orc(
...
)
PARTITIONED BY (day int )
STORED AS ORC
LOCATION '/test/test_orc/'
tblproperties ("orc.compress"="SNAPPY");
默认为tblproperties(“orc.compress”=”ZLIB”);
2.parquet
create table test_parquet(
...
)
PARTITIONED BY (day int )
STORED AS parquet
LOCATION '/test/test_parquet/'
;
CREATE TABLE … STORED AS ORC
ALTER TABLE … SET FILEFORMAT ORC
SET hive.default.fileformat=ORC
参考:
http://blog.csdn.net/bingduanlbd/article/details/52088520
https://www.cnblogs.com/zhenjing/archive/2012/11/02/File-Format.html
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。