Hadoop(一),Hadoop(
-
目录
Hadoop背景介绍
Hadoop生产背景
Hadoop在大数据云计算中位置和关系
Hadoop案例
Hadoop重要组件
什么是分布式系统
离线数据的分析流程
Hadoop单机版实际操作
HDFS分布式文件系统
HDFS的核心设计思想和作用
NameNode和DataNode
HDFS在Hadoop中存储模型:
-
Hadoop背景介绍
- Apache Hadoop是一个可靠的,可扩展的分布式计算开发软件
- Apache Hadoop可以理解为一个框架,它允许使用简单的编程模型来计算分布式的大型数据集合(海量数据)
- http://hadoop.apache.org/ 官网
- 包括模块
-
Hadoop生产背景
- Nutch的目的是设计一个发行的全网络的搜索引擎
- 随着网络的发展,碰到了一个瓶颈
-
Hadoop在大数据云计算中位置和关系
- 云计算是分布式计算,并行技术,网络计算,多核计算,网络存储,虚拟化,负载均衡等传统的额计算和互联网技术融合的一个产物
- 云计算分为几大类
-
Hadoop案例
-
Hadoop重要组件
-
什么是分布式系统
- 常用的分布式软件系统的案例
-
离线数据的分析流程
-
Hadoop单机版实际操作
-
HDFS分布式文件系统
- HDFS设计目标:
- HDFS的优点:
- HDFS的缺点:
-
HDFS的核心设计思想和作用
-
NameNode和DataNode
- 以上文件保存在linux中。(hadoop/dfs/name)
- NameNode工作特点:
- DataNode:
-
HDFS在Hadoop中存储模型:
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。