欢迎投稿

今日深度:

Hadoop之MapReduce,

Hadoop之MapReduce,


1、MapReduce 的优点
MapReduce是一种处理技术和程序模型基于Java的分布式计算。大规模数据处理在多个计算节点。
2、算法
Ⅰ、MapReduce范例是基于向发送计算机数据的位置
Ⅱ、MapReduce计划分三个阶段执行,即映射阶段,shuffle阶段,并减少阶段。
映射阶段:映射或映射器的工作是处理输入数据。
减少阶段:Shuffle阶段和Reduce阶段的组合。

Ⅲ、在一个MapReduce工作,Hadoop的发送Map和Reduce任务到集群的相应服务器。

Ⅳ、框架管理数据传递例如发出任务的所有节点之间的集群周围的详细信息,验证任务完成,和复制数据。

Ⅴ、大部分的计算发生在与在本地磁盘上,可以减少网络通信量数据的节点。

Ⅵ、给定的任务完成后,将群集收集并减少了数据,以形成一个合适的结果,并且将其发送回Hadoop服务器。

Ⅶ、MapReduce工作
- Map任务:分割、映射
- Reduce任务:重排、还原
Ⅷ、完整的执行流程(执行 Map 和 Reduce 任务)是由两种类型的实体的控制,称为
- Jobtracker : 就像一个主(负责提交的作业完全执行)
- 多任务跟踪器 : 充当角色就像从机,它们每个执行工作

www.htsjk.Com true http://www.htsjk.com/Hadoop/41773.html NewsArticle Hadoop之MapReduce, 1、MapReduce 的优点 MapReduce是一种处理技术和程序模型基于Java的分布式计算。大规模数据处理在多个计算节点。 2、算法 Ⅰ、MapReduce范例是基于向发送计算机数据的位置...
相关文章
    暂无相关文章
评论暂时关闭