Hadoop之shuffle,
- 完整地从map task端拉取数据到reduce端。
- 在跨节点拉取数据时,尽可能地减少对带宽的不必要消耗。
- 减少磁盘IO对task执行的影响。
优化的地方主要在于减少拉取数据的量及尽量使用内存而不是磁盘。
转载地址:https://www.cnblogs.com/sunfie/p/4928662.html
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。