Hive 优化,
1、尽量不用 select *
2、输入文件不要是大量的小文件,hive默认的分片是128M小文件可以先合并成大文件
对于 group by 引起的倾斜,优化措施
set hive.map.aggr=true;
set hive.groupby.skewindata=true
count distinct 优化 可以通过先 group by 再count的方式来优化
select count(distinct user) from some_table
select count(*) from ( select user from some_table group by user) tmp;
大表join大表引发的倾斜
set hive.optimise.skewinfo=table_B:(字段)[("0")("1")];
set hive.optimise.skewjoin=true;
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。