hadoop，

和通数据库htsjk.Com2019-11-02 21:55 来源:未知阅读:12596 评论 285 热度3

标签：

hadoop，

Hadoop的起源
Doug Cutting是Hadoop之父，起初他开创了一个开源软件Lucene（用Java语言编写，提供了全文检索引擎的架构，与Google类似），Lucene后来面临与Google同样的错误。于是，Doug Cutting学习并模仿Google解决这些问题的办法，产生了一个Lucene的微缩版Nutch。

 后来，Doug Cutting等人根据2003-2004年Google公开的部分GFS和Mapreduce思想的细节，利用业余时间实现了GFS和Mapreduce的机制，从而提高了Nutch的性能。由此Hadoop产生了。

  Hadoop于2005年秋天作为Lucene的子项目Nutch的一部分正式引入Apache基金会。2006年3月份，Map-Reduce和Nutch Distributed File System(NDFS)分别被纳入Hadoop的项目中。 
  关于Hadoop名字的来源，是Doug Cutting儿子的玩具大象。

Hadoop是什么？
Hadoop是一个开源框架，可编写和运行分布式应用处理大规模数据。 Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系统，MapReduce 是分布式数据处理模型和执行环境。

在一个宽泛而不断变化的分布式计算领域，Hadoop凭借什么优势能脱颖而出呢？
1. 运行方便：Hadoop是运行在由一般商用机器构成的大型集群上。Hadoop在云计算服务层次中属于PaaS(Platform-as-a- Service)：平台即服务。
2. 健壮性：Hadoop致力于在一般的商用硬件上运行，能够从容的处理类似硬件失效这类的故障。
3. 可扩展性：Hadoop通过增加集群节点，可以线性地扩展以处理更大的数据集。
4. 简单：Hadoop允许用户快速编写高效的并行代码。

Hadoop2.0时代的生态系统如下：

image.png

HDFS(分布式文件系统)

  HDFS源自于Google发表于2003年10月的GFS论文，也即是说HDFS是GFS的克隆版。此处只是HDFS的概述，更多详细的深入剖析，我将在后续的

				
					http://www.htsjk.com/Hadoop/38354.html
					www.htsjk.Com
					true
					http://www.htsjk.com/Hadoop/38354.html
					NewsArticle
					hadoop， Hadoop的起源 Doug Cutting是Hadoop之父 ，起初他开创了一个开源软件Lucene（用Java语言编写，提供了全文检索引擎的架构，与Google类似），Lucene后来面临与Google同样的错误。于是，Do...
				
				
				


本站文章为和通数据库网友分享或者投稿，欢迎任何形式的转载，但请务必注明出处.

同时文章内容如有侵犯了您的权益，请联系QQ：970679559，我们会在尽快处理。


返回首页





				

			相关文章
			暂无相关文章


            评论暂时关闭