Hadoop概述,
1.什么是hadoop?
hadoop是一个分布式系统基础架构,由apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
它包括三部分:HDFS,YARN,和MapReduce。
HDFS:Hadoop分布式文件系统
YARN:任务调度和集群资源管理框架。
MapReduce:能够基于YARN并行的处理大规模的数据集。
2.狭义hadoop和广义的hadoop
狭义hadoop:是一个适合大数据分布式存储(HDFS)、分布式计算(MR)和资源调度(YARN)平台。
广义hadoop:指hadoop生态系统。hadoop是其中最重要最基础的一个部分。生态系统中的每一个子系统只能解决某一个领域的特定问题域。
hadoop生态系统:
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。