Hadoop之Hadoop基础知识,
Hadoop之Hadoop基础知识复习
目录
1. Hadoop是什么
1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
2)主要解决的是海量数据的存储和海量数据的分析计算问题。
3)广义上来说,HADOOP通常是指一个更广泛的概念——HADOOP生态圈。
2. Hadoop的优势
1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
2)高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。
3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。
4)高容错性:能够自动将失败的任务重新分配。
3. Hadoop组成
YARN架构概述
MapReduce架构概述
MapReduce将计算过程分为两个阶段:Map和Reduce,如下图所示
1)Map阶段并行处理输入数据
2)Reduce阶段对Map结果进行汇总
4. 大数据技术生态体系
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。