欢迎投稿

今日深度:

Hadoop之shuffle,

Hadoop之shuffle,


  • 完整地从map task端拉取数据到reduce端。
  • 在跨节点拉取数据时,尽可能地减少对带宽的不必要消耗。
  • 减少磁盘IO对task执行的影响。

    优化的地方主要在于减少拉取数据的量及尽量使用内存而不是磁盘。

转载地址:https://www.cnblogs.com/sunfie/p/4928662.html

www.htsjk.Com true http://www.htsjk.com/Hadoop/41501.html NewsArticle Hadoop之shuffle, 完整地从map task端拉取数据到reduce端。 在跨节点拉取数据时,尽可能地减少对带宽的不必要消耗。 减少磁盘IO对task执行的影响。      优化的地方主要在于减少拉取数据...
相关文章
    暂无相关文章
评论暂时关闭