欢迎投稿

今日深度:

Hive 使用,

Hive 使用,


使用技巧:

 1, 多insert 查询注意

        1.1 多insert 加where 条件时会导致数据不准确

                例: from (select a, b ,c from t0) tmp

                      insert overwrite table tmp1 partition(dt='yyyy-MM-dd')

                                select a,b,c where c>0

                      insert overwrite table tmp2 partition(dt='yyyy-MM-dd')

                                select a,b,c where b>0

 

QA:

 1,执行select时报:java heap outofmemory

       解决办法:

                       Map端:

                       set mapreduce.map.memory.mb=8192;
                       set mapreduce.map.java.opts=-Xmx6144m;

                       Reduce端: 

                       set mapreduce.reduce.memory.mb=8192;
                       set mapreduce.reduce.java.opts=-Xmx6144m;

2, parquet格式hive表更改字段名后,查询该字段历史数据为null问题

    解决办法: ALTER TABLE tableName SET TBLPROPERTIES ('parquet.column.index.access'='true');

www.htsjk.Com true http://www.htsjk.com/hive/41407.html NewsArticle Hive 使用, 使用技巧:  1, 多insert 查询注意         1.1 多insert 加where 条件时会导致数据不准确                 例: from (select a, b ,c from t0) tmp                       insert overwri...
相关文章
    暂无相关文章
评论暂时关闭