欢迎投稿

今日深度:

Hadoop之shuffle,

Hadoop之shuffle, 完整地从map task端拉取数据到reduce端。 在跨节点拉取数据时,尽可能地减少对带宽的不必要消耗。 减少磁盘IO对task执行的影响。      优化的地方主要在于减少拉取数据...(发布于2020-02-01 21:49:38)

Hadoop Start,

Hadoop Start, Hadoop Start....(发布于2020-02-01 21:49:34)

hadoop的环境配置,

hadoop的环境配置,            写在前面:这一篇文章是应该是科协最后一次上课的备课内容,写完这一篇博客,我想,我已经把我懂得的成熟的技术都毫无保留的尽力教授给我的学生...(发布于2020-02-01 21:49:30)

hadoop 部署,

hadoop 部署, 基础组件 准备安装Hadoop集群之前我们得先检验系统是否安装了如下的必备软件:ssh、rsync和Jdk1.6(因为Hadoop需要使用到Jdk中的编译工具,所以一般不直接使用Jre)。可以使...(发布于2020-02-01 21:49:26)

Hadoop集群配置,

Hadoop集群配置, 1.在进行Hadoop集群配置中,需要在/etc/hosts文件中添加集群中所有机器的IP与主机名,这样Master与所有的Slave机器之间不仅可以通过IP进行通信,还可以通过主机名进行通信...(发布于2020-02-01 21:49:18)

hadoop 二次排序,

hadoop 二次排序,   hadoop的工作流程: http://blackproof.iteye.com/blog/2028640   hadoop 二次排序 是在key中,排序value的实现,思路是 1.把value中需要有序的部分value-part放入key中 2.sortCompare类或k...(发布于2020-01-31 21:48:07)

Hadoop, Hbase,

Hadoop, Hbase, https://antkillerfarm.github.io/ Hadoop 最近(2016.4),参加公司组织的内部培训,对Hadoop有了一些认识,特记录如下。 概述 Hadoop项目由Doug Cutting创建。Doug Cutting也是Lucene项目的创...(发布于2020-01-31 21:48:03)

hadoop,

hadoop, 转自:http://www.kakuka.net/?p=37replytocom=2...(发布于2020-01-31 21:47:59)

Hadoop Streaming,

Hadoop Streaming, Hadoop MapReduce和HDFS采用Java实现,默认提供Java编程接口,另外提供了C++编程接口和Streaming框架。Streaming框架允许 任何程序语言 实现的程序在Hadoop MapReduce中使用,方便已有...(发布于2020-01-31 21:47:55)

hadoop 参数,

hadoop 参数,            集群升级,参考一下。http://www.tbdata.org/archives/1470 hadoop作业调优参数整理及原理 摘要: 1 Map side tuning参数 1.1 MapTask运行内部原理 当map task开始运算,并产生...(发布于2020-01-31 21:47:51)

hadoop安装部署,

hadoop安装部署, 1.下载hadoop-0.20.2 wget http://mirror.bjtu.edu.cn/apache/hadoop/core/stable/hadoop-0.20.2.tar.gz   2.修改/etc/hosts文件,添加所有节点的ip-host映射 192.168.221.174 h1 192.168.221.175 h2 192.168.221.176...(发布于2020-01-31 21:47:48)

hadoop 开发,

hadoop 开发, 如何在Hadoop上编写MapReduce程序 http://dongxicheng.org/mapreduce/writing-hadoop-programes/ http://dongxicheng.org/category/mapreduce/...(发布于2020-01-31 21:47:44)

Hadoop EcoSystem,

Hadoop EcoSystem,...(发布于2020-01-31 21:47:40)

Hadoop 伪分布式,

Hadoop 伪分布式, 在搭建Hadoop单机模式成功后,进入下一个,伪分布模式; 确保已安装SSH 首先修改配置文件;hadoop 2.7.3的配置文件在Hadoop_home/etc/hadoop目录下。依次修改 core-site.xml hdfs...(发布于2020-01-31 21:47:36)

hadoop 压缩解压,

hadoop 压缩解压, 先放代码 package com.huawei.hdfs.compress;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.io.IOUtils;import org.apache.hadoop.io.compress.*;import org.apache.hadoop.util.ReflectionUtils;import...(发布于2020-01-31 21:47:27)

Hadoop tips,

Hadoop tips, 关于MapReduce的内容,建议看看孟岩的这篇 MapReduce:The Free Lunch Is Not Over! 《理解矩阵》 PageRank from Google黑板报 安装RHEL6.1: http://wenku.baidu.com/view/433943c56137ee06eff9183c.html http://www...(发布于2020-01-30 21:46:56)

hadoop基础知识,

hadoop基础知识, Hadoop是一个开发和运行处理大规模数据的软件平台,是Apache的一个用java语言实现的开源分布式系统框架, 用户可以在不了解分布式底层细节的情况下,开发分布式程序...(发布于2020-01-30 21:46:53)

Hadoop(二),

Hadoop(二), ----------------------------1701B—裴博润------------------------------      ---*-----------------------复习-------------------------*--- Linux Linux是一套免费使用和自由传播的类Unix的操作系统 c语...(发布于2020-01-30 21:46:48)

hadoop介绍:,

hadoop介绍:,     大数据绝大多数框架,都是Apache顶级项目     Hadoop官网:     hadoop.apache.org     分布式:         相对于集中式         需要多台机器,协调完成任务   ...(发布于2020-01-30 21:46:45)

hadoop安装之-hadoop,

hadoop安装之-hadoop, 一、hadoop的三种安装模式 1,单机模式      解压源码包后不用更改配置文件,就可以运行,主要用于开发调试MapReduce程序的应用逻辑。 2,伪分布式      伪分布...(发布于2020-01-30 21:46:41)