Hive 优化，

和通数据库htsjk.Com2019-12-23 22:56 来源:未知阅读:10729 评论 205 热度5

标签：

1、尽量不用 select *

2、输入文件不要是大量的小文件，hive默认的分片是128M小文件可以先合并成大文件

对于 group by 引起的倾斜，优化措施

set hive.map.aggr=true;

set hive.groupby.skewindata=true

count distinct 优化可以通过先 group by 再count的方式来优化

select count(distinct user) from some_table

select count(*) from ( select user from some_table group by user) tmp;

大表join大表引发的倾斜

set hive.optimise.skewinfo=table_B:(字段)[("0")("1")];

set hive.optimise.skewjoin=true;

本站文章为和通数据库网友分享或者投稿，欢迎任何形式的转载，但请务必注明出处.
同时文章内容如有侵犯了您的权益，请联系QQ：970679559，我们会在尽快处理。

暂无相关文章

评论暂时关闭