欢迎投稿

今日深度:

《十小时入门大数据》学习笔记之初识Hadoop,

《十小时入门大数据》学习笔记之初识Hadoop,


笔记内容概括

1、Hadoop概述

1.1 Hadoop名字的由来

  • Hadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名

    图片.png

    Hadoop的官网: http://hadoop.apache.org ,一定要学会看官网、养成看官网的习惯。

1.2 Hadoop介绍

Hadoop是Apache的一个顶级项目、是开源的、分布式存储+分布式计算平台;它由以下几个模块构成:

Hadoop Common: 这是支持hadoop其他模块的通用工具模块

Hadoop Distributed File System(HDFS):分布式文件系统

Hadoop YARN: 统一资源管理和任务调度

Hadoop MapReduce:基于yarn系统的分布式计算框架

下图是官网的描述:

图片.png

1.3 Hadoop能做什么

搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务,如:智能商业、日志分析、搜索引擎、数据挖掘等场景。

2、Hadoop核心组件

/2.1 HDFS(分布式文件系统)

  • 源自于Google的GFS论文,论文发表于2003年10月
  • HDFS是GFS的克隆版
  • HDFS特点:扩展性&容错性&海量数据存储
  • 将文件切分成指定大小的数据块并以多副本的存储在多个机器上
  • 数据切分、多副本、容错等操作对用户是透明的

    图片.png

2.2 YARN(资源调度系统)

  • YARN: Yet Another Resource Negotiator
  • 负责整个集群资源的管理和调度
  • YARN特点:扩展性&容错性&多框架资源统一调度

    图片.png

2.3 MapReduce(分布式计算框架)

  • 源自于Google的MapReduce论文。论文发表于2004年12月
  • MapReduce是Google MapReduce的克隆版
  • MapReduce特点: 扩展性&容错性&海量数据离线处理

    图片.png

3、Hadoop优势

(1)、高可靠性

  • 数据存储:数据块多副本
  • 数据计算: 重新调度作业计算 
    (2)、高扩展性
  • 存储/计算资源不够时,可以横向的线性扩展机器
  • 一个集群中可以包含数以千计的节点 
    (3)、其他
  • 存储在廉价机器上,降低成本
  • 成熟的生态圈

4、Hadoop的发展史

这篇博文有很详细的介绍:十年了,Hadoop的前世今生 博文链接

5、Hadoop生态系统

5.1 狭义Hadoop VS 广义Hadoop

  • 狭义Hadoop: 
    指的是一个适合大数据分布式存储(HDFS)、分布式计算(MapReduce)和资源调度(YARN)平台,即传统意义上的Hadoop。
  • 广义Hadoop:指的是整个Hadoop生态系统,Hadoop生态系统是一个很庞大的概念,Hadoop是其中最重要最基础的一部分;生态系统中的每一个子系统 只能解决某一特定的问题域 (甚至可能很窄),不搞统一型的一个全能系统,而是 小而精的多个小系统 。 

    图片.png

5.2 Hadoop生态系统的特点

  • 开源、社区活跃
  • 囊括了大数据处理的方方面面
  • 成熟的生态圈

6、 Hadoop常用发行版本和和选型

  • Apcahe Hadoop:存在jar包冲突的问题,一般只用于学习;
  • CDH(Cloudera Distributed Hadoop):商业版,不存在jar冲突问题,配置简单、文档详细,具有容易升级的优点,生产环境中大多选择该版本,缺点是代码不开源, 下载地址 ;
  • HDP(Hortonworks Data Platform):存在安装升级和删除节点困难的问题,一般也应用于商业场景。需要更多大数据开发相关学习资料(Hadoop,spark,kafka,MapReduce,scala,,推荐算法,实时交易监控系统,用户分析行为,推荐系统)加群免费获取:792133408

www.htsjk.Com true http://www.htsjk.com/Hadoop/26188.html NewsArticle 《十小时入门大数据》学习笔记之初识Hadoop, 笔记内容概括 1、Hadoop概述 1.1 Hadoop名字的由来 Hadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名 图片.png Hadoop的官网: h...
相关文章
    暂无相关文章
评论暂时关闭