欢迎投稿

今日深度:

hadoop集群配置,

hadoop集群配置, 官方地址:( http://hadoop.apache.org/common/docs/r0.19.2/cn/cluster_setup.html ) 转自http://blog.csdn.net/hguisu/article/details/7237395 1 先决条件 确保在你集群中的每个节点上都安装了所有必需...(发布于2020-02-11 21:49:29)

hadoop简介,

hadoop简介, hadoop是什么          1.hadoop是一个开源, 可以更容易开发和处理 大规模数据 的 软件平台 ,包括2部分:HDFS和MapReduce                   它提供云平台的基础架构...(发布于2020-02-11 21:49:25)

Hadoop 二次排序,

Hadoop 二次排序, 对value进行排序。     实现过程:     1.ComboKey(WritableComparable)         对比方法。 package com.mao.hdfs.secondSort;import org.apache.hadoop.io.WritableComparable;import java.io.DataInpu...(发布于2020-02-11 21:49:21)

hadoop笔记本,

hadoop笔记本, hadoop笔记本 海量数据 那些年Google公开的大数据领域论文 大数据量,海量数据 处理方法总结 布隆过滤器应用 Google Dremel 原理 – 如何能3秒分析1PB    Google Spanner原理- 全球...(发布于2020-02-11 21:49:17)

hadoop中文文档,

hadoop中文文档, http://hadoop.apache.org/docs/r0.20.0/cn/cluster_setup.html...(发布于2020-02-11 21:49:13)

hadoop的安装,

hadoop的安装, hadoop的安装和配置 --------------前提 首先,你可以去官网或者各种途径下载Hadoop,本篇文章主要参考了老师所讲,步骤详细,辅以适当说明,相信按照步骤来,都能顺利在...(发布于2020-02-11 21:49:10)

hadoop远程调试,

hadoop远程调试, 1、修改etc/hadoop/yarn.sh,增加以下内容 export YARN_NODEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8788,server=y,suspend=y” export YARN_RESOUCEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_s...(发布于2020-02-11 21:49:06)

hadoop学习,

hadoop学习, 记录几个大神写的,方便学习 1.(转) 零基础学习hadoop到上手工作线路指导(初级篇) 2.(转)  零基础学习hadoop到上手工作线路指导初级篇:hive及mapreduce 这篇把mapreduce讲的比...(发布于2020-02-11 21:49:02)

hadoop 文件合并,

hadoop 文件合并, 众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。 1,getmerge hadoop有一个命令行工具...(发布于2020-02-11 21:48:58)

hadoop开发环境搭建,

hadoop开发环境搭建,   Hadoop分布式的好处: DFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员...(发布于2020-02-11 21:48:51)

Hadoop 参数,

Hadoop 参数, 转发自:http://www.cnblogs.com/ggjucheng/archive/2012/04/17/2454590.html hadoop集群默认配置和常用配置 获取默认配置 配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件...(发布于2020-02-10 21:53:26)

Hadoop 安装配置,

Hadoop 安装配置, 主要安装流程和注意事项     红色两天要特别注意   1. 安装JDK,JRE  (jdk-7u3-linux-x64.tar.gz) 64位操作系统 2. 设置环境变量JAVA_HOME and PATH (/etc/profile) 对所有用户都生效  ...(发布于2020-02-10 21:53:22)

Hadoop学习,

Hadoop学习, Hadoop基本原理介绍: [url]http://wangwei.cao.blog.163.com/blog/static/10236252620130253346928/[/url] Hadoop体系架构 [url]http://blog.sina.com.cn/s/blog_a94476040101c9qo.html[/url] [url]http://www.open-open.com/lib...(发布于2020-02-10 21:53:18)

hadoop之二,

hadoop之二, a)   单节点集群的安装 参考http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/ 配置ssh(无密码连接到localhost) $ chmod g-w ~/.ssh/authorized_keys【这里尤其注意...(发布于2020-02-10 21:53:14)

hadoop之一,

hadoop之一, 暂且隐去具体什么项目,需要处理存储海量数据,一次存储多次读取,数据用作建模分析以及检索。 本人比较倒霉,部署时基本能遇到的问题都遇到了。。好吧,Hadoop配置...(发布于2020-02-10 21:53:11)

hadoop mapreduce,

hadoop mapreduce, hadoop mapreduce         最近整了很长一段时间才了解了map reduce的工作原理, shuffle是mapreduce的心脏,了解了这个过程,有助于编写效率更高的mapreduce程序和hadoop调优 。自...(发布于2020-02-10 21:53:06)

Hadoop DistributedCache,

Hadoop DistributedCache, 1、DistributedCache In Hadoop 此篇文章主要是前一篇的后续,主要讲Hadoop的分布式缓存机制的原理与运用。 分布式缓存在MapReduce中称之为DistributedCache,它可以方便map ta...(发布于2020-02-10 21:53:02)

Hadoop初识,

Hadoop初识, 写在前面 本文带你更好了解hadoop的一些知识。 Hadoop概述 Hadoop官方网站是:http://hadoop.apache.org/ 名称由来? Hadoop这个名称其实没有实际意义,只是hadoop作者小孩的一个大象玩...(发布于2020-02-10 21:52:59)

Hadoop入门,

Hadoop入门, Hadoop入门(基于mac) ·Hadoop安装与配置 由于使用mac电脑进行Hadoop操作,我讲使用Vmware Fusion虚拟机进行操作。首先需要在电脑上下载好Vmware Fusion虚拟机和linux系统镜像文件...(发布于2020-02-10 21:52:54)

hadoop 倒排索引,

hadoop 倒排索引, 原文:http://blog.csdn.net/ludengji/article/details/6872664 [java]  view plaincopy 倒排索引是文档检索系统中最常用的数据结构,被广泛的应用于全文搜索引擎。它主要用来存储某个...(发布于2020-02-10 21:52:49)