欢迎投稿

今日深度:

hive 导出数据,

hive 导出数据,


1. 导出到hdfs

insert overwrite directory '$hdfs_dir' select distinct concat(query,'\t',query_hash) from table_name  where day='$day';

导出到hdfs ,不能指定分隔符,只能用默认的^A ,且不可见。想要以tab做分隔符,通过concat实现。

默认的分割是“CTR+A”,ASCII码排第二位的字符,是不可见字符,二进制表示:'\u0001'。

如果用sed进行替换,sed  -i "s/^A/\t/g" file

2. 导出到本地路径

可以指定分隔符

insert overwrite directory '/tmp/test' row format DELIMITED FIELDS TERMINATED BY  '\t ' select * from table_name;

3. 导出到hive表

insert overwrite table  t1 select * from t2;

hive不支持 子查询结果直接建表,如 create table t1 as select * from t2; 在hive中是错误的

www.htsjk.Com true http://www.htsjk.com/hive/41725.html NewsArticle hive 导出数据, 1. 导出到hdfs insert overwrite directory '$hdfs_dir' select distinct concat(query,'\t',query_hash) from table_name  where day='$day'; 导出到hdfs ,不能指定分隔符,只能用默认的^A ,且不可见。想...
相关文章
    暂无相关文章
评论暂时关闭