hive 导出数据,
1. 导出到hdfs
insert overwrite directory '$hdfs_dir' select distinct concat(query,'\t',query_hash) from table_name where day='$day';
导出到hdfs ,不能指定分隔符,只能用默认的^A ,且不可见。想要以tab做分隔符,通过concat实现。
默认的分割是“CTR+A”,ASCII码排第二位的字符,是不可见字符,二进制表示:'\u0001'。
如果用sed进行替换,sed -i "s/^A/\t/g" file
2. 导出到本地路径
可以指定分隔符
insert overwrite directory '/tmp/test' row format DELIMITED FIELDS TERMINATED BY '\t ' select * from table_name;
3. 导出到hive表
insert overwrite table t1 select * from t2;
hive不支持 子查询结果直接建表,如 create table t1 as select * from t2; 在hive中是错误的
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。