欢迎投稿

今日深度:

Hadoop之Hadoop基础知识,

Hadoop之Hadoop基础知识,


Hadoop之Hadoop基础知识复习


目录


1. Hadoop是什么

1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
2)主要解决的是海量数据的存储和海量数据的分析计算问题。
3)广义上来说,HADOOP通常是指一个更广泛的概念——HADOOP生态圈。


2. Hadoop的优势

1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
2)高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。
3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。
4)高容错性:能够自动将失败的任务重新分配。


3. Hadoop组成

  • YARN架构概述

  • MapReduce架构概述
    MapReduce将计算过程分为两个阶段:Map和Reduce,如下图所示
    1)Map阶段并行处理输入数据
    2)Reduce阶段对Map结果进行汇总


  • 4. 大数据技术生态体系

    www.htsjk.Com true http://www.htsjk.com/Hadoop/36203.html NewsArticle Hadoop之Hadoop基础知识, Hadoop之Hadoop基础知识复习 目录 1. Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2)主要解决的是海量数据的存储和海量数据的分析计算...
    相关文章
      暂无相关文章
    评论暂时关闭