欢迎投稿

今日深度:

hadoop (六)重新认识hadoop,

hadoop (六)重新认识hadoop, hadoop (六)重新认识hadoop MapReudue 思想 MapReudue采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各分节点共同完成,然后通过...(发布于2020-01-22 21:50:50)

《Hadoop权威指南》---初识Hadoop,

《Hadoop权威指南》---初识Hadoop, 一、数据 对于目前这个信息爆炸的时代,也就是我们所说的大数据时代,信息存储的体量是越来越大,存储和分析的难度也是越来越大,可是在解决这...(发布于2020-01-22 21:50:47)

Hadoop学习笔记之Hadoop基本介绍,

Hadoop学习笔记之Hadoop基本介绍, 说到Hadoop的起源,不得不说到一个传奇的IT公司—全球IT技术的引领者Google。Google(自称)为云计算概念的提出者,在自身多年的搜索引擎业务中构建了...(发布于2020-01-22 21:50:43)

初识Hadoop,Hadoop是什么?,

初识Hadoop,Hadoop是什么?, 前言: Hadoop是一个分布式系统基础架构。 基本概述: Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称 HDFS 。 HDFS有高容错性的特点,并且...(发布于2020-01-22 21:50:39)

hadoop 学习笔记(hadoop架构),

hadoop 学习笔记(hadoop架构), 如下图所示: client —用户 switch—交换机 rack—机架 namenode—名称节点,是hdfs(分布式文件系统)的守护程序,起到一个总控制的作用,记录文件是如何...(发布于2020-01-22 21:50:35)

Hadoop fs 和Hadoop dfs,

Hadoop fs 和Hadoop dfs, (1)fs是文件系统, dfs是分布式文件系统 (2)fs dfs (3)分布式环境情况下,fs与dfs无区别                        (4)本地环境中,fs就是本地文件,dfs就不能用...(发布于2020-01-22 21:50:31)

《Hadoop基础教程》之初识Hadoop,

《Hadoop基础教程》之初识Hadoop, Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬...(发布于2020-01-22 21:50:27)

【Hadoop】Hadoop MR 自定义排序,

【Hadoop】Hadoop MR 自定义排序, 1、概念 2、代码示例 FlowSort package com.ares.hadoop.mr.flowsort;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;import org.apa...(发布于2020-01-22 21:50:23)

Hadoop学习笔记_初识Hadoop,

Hadoop学习笔记_初识Hadoop, Hadoop是适合大数据的分布式存储与计算平台,分布式存储即HDFS(Hadoop Distributed File System),计算平台即MapReduce。Hadoop是分布式存储数据,在存储过程中会有数据通...(发布于2020-01-22 21:50:19)

【Hadoop】HADOOP 总结--思维导图,

【Hadoop】HADOOP 总结--思维导图,...(发布于2020-01-22 21:50:10)

《Hadoop基础教程》之初识Hadoop,

《Hadoop基础教程》之初识Hadoop, Hadoop一直是我想学习的技术,正巧最近项目组要做电子商城,我就开始研究Hadoop,虽然最后鉴定Hadoop不适用我们的项目,但是我会继续研究下去,技多不...(发布于2020-01-22 05:48:00)

【Hadoop】搭建完全分布式的hadoop,

【Hadoop】搭建完全分布式的hadoop, 用于测试,我用4台虚拟机搭建成了hadoop结构 我用了两个台式机。一个xp系统,一个win7系统。每台电脑装两个虚拟机,要不然内存就满了。   1、安装...(发布于2020-01-22 05:47:56)

【Hadoop】搭建完全分布式的hadoop,

【Hadoop】搭建完全分布式的hadoop, 博客已转移,请借一步说话! http://www.weixuehao.com/archives/577   下面博文已更新,请移步 ↑   用于测试,我用4台虚拟机搭建成了hadoop结构 我用了两个...(发布于2020-01-22 05:47:52)

hadoop,

hadoop, Hadoop Hadoop实现了一个分布式文件系统。Hadoop的框架最核心的设计就是:HDFS和MapReduce。 HDFS为海量的数据提供了存储 MapReduce则为海量的数据提供了计算。 详细介绍可访问网址:...(发布于2020-01-22 05:47:48)

hadoop RPC,

hadoop RPC, Hadoop RPC是Hadoop的一个重要部分,提供分布式环境下的对象调用功能,源码在org.apache.hadoop.ipc中。而HBase也几乎完全copy了这部分的源码,只是在配置项上面有所改动。 关于Ha...(发布于2020-01-22 05:47:44)

Hadoop之压缩,

Hadoop之压缩, 1 gzip压缩 优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带...(发布于2020-01-22 05:47:40)

hadoop 倒排索引,

hadoop 倒排索引, 倒排索引是文档检索系统中最常用的数据结构,被广泛的应用于全文搜索引擎。它主要用来存储某个单词(或词组),在一个文档或一组文档中的存储位置的映射,即...(发布于2020-01-22 05:47:36)

Hadoop  HA,

Hadoop  HA, Hadoop  HA 是什么? hadoop2.x版本中可以有多个namenode结点,一个是活跃(active)状态,一个是准备(standby)状态。 HDFS HA背景 HDFS集群中NameNode 存在单点故障(SPOF)。对于只...(发布于2020-01-22 05:47:32)

Hadoop 安装,

Hadoop 安装, 1.虚机拓扑   2.下载hadoop,使用版本hadoop-0.20.2 http://archive.apache.org/dist/hadoop/core/hadoop-0.20.2/ 3.配置所有节点Host文件,保证集群内部名称解析 4.建立专门的运行hadoop的用户,g...(发布于2020-01-22 05:47:28)

hadoop helloworld,

hadoop helloworld,   环境:ubuntu+hadoop2.6.4   hadoop分成3大类: 1、单机式 2.1、伪分布式+非yarn 2.2、伪分布+yarn 3、集群     参考链接:   Hadoop安装链接   Hadoop Java代码 HelloWorld      ...(发布于2020-01-22 05:47:24)