欢迎投稿

今日深度:

hadoop的安装,

hadoop的安装, hadoop的安装和配置 --------------前提 首先,你可以去官网或者各种途径下载Hadoop,本篇文章主要参考了老师所讲,步骤详细,辅以适当说明,相信按照步骤来,都能顺利在...(发布于2020-02-11 21:49:10)

hadoop远程调试,

hadoop远程调试, 1、修改etc/hadoop/yarn.sh,增加以下内容 export YARN_NODEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8788,server=y,suspend=y” export YARN_RESOUCEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_s...(发布于2020-02-11 21:49:06)

hadoop学习,

hadoop学习, 记录几个大神写的,方便学习 1.(转) 零基础学习hadoop到上手工作线路指导(初级篇) 2.(转)  零基础学习hadoop到上手工作线路指导初级篇:hive及mapreduce 这篇把mapreduce讲的比...(发布于2020-02-11 21:49:02)

hadoop 文件合并,

hadoop 文件合并, 众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。 1,getmerge hadoop有一个命令行工具...(发布于2020-02-11 21:48:58)

hadoop开发环境搭建,

hadoop开发环境搭建,   Hadoop分布式的好处: DFS 为基础的分布式计算框架和key、value 数据高效的解决运算的瓶颈,而且开发人员不用再写复杂的分布式程序,只要底层框架完备开发人员...(发布于2020-02-11 21:48:51)

Hadoop 参数,

Hadoop 参数, 转发自:http://www.cnblogs.com/ggjucheng/archive/2012/04/17/2454590.html hadoop集群默认配置和常用配置 获取默认配置 配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件...(发布于2020-02-10 21:53:26)

Hadoop 安装配置,

Hadoop 安装配置, 主要安装流程和注意事项     红色两天要特别注意   1. 安装JDK,JRE  (jdk-7u3-linux-x64.tar.gz) 64位操作系统 2. 设置环境变量JAVA_HOME and PATH (/etc/profile) 对所有用户都生效  ...(发布于2020-02-10 21:53:22)

Hadoop学习,

Hadoop学习, Hadoop基本原理介绍: [url]http://wangwei.cao.blog.163.com/blog/static/10236252620130253346928/[/url] Hadoop体系架构 [url]http://blog.sina.com.cn/s/blog_a94476040101c9qo.html[/url] [url]http://www.open-open.com/lib...(发布于2020-02-10 21:53:18)

hadoop之二,

hadoop之二, a)   单节点集群的安装 参考http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/ 配置ssh(无密码连接到localhost) $ chmod g-w ~/.ssh/authorized_keys【这里尤其注意...(发布于2020-02-10 21:53:14)

hadoop之一,

hadoop之一, 暂且隐去具体什么项目,需要处理存储海量数据,一次存储多次读取,数据用作建模分析以及检索。 本人比较倒霉,部署时基本能遇到的问题都遇到了。。好吧,Hadoop配置...(发布于2020-02-10 21:53:11)

hadoop mapreduce,

hadoop mapreduce, hadoop mapreduce         最近整了很长一段时间才了解了map reduce的工作原理, shuffle是mapreduce的心脏,了解了这个过程,有助于编写效率更高的mapreduce程序和hadoop调优 。自...(发布于2020-02-10 21:53:06)

Hadoop DistributedCache,

Hadoop DistributedCache, 1、DistributedCache In Hadoop 此篇文章主要是前一篇的后续,主要讲Hadoop的分布式缓存机制的原理与运用。 分布式缓存在MapReduce中称之为DistributedCache,它可以方便map ta...(发布于2020-02-10 21:53:02)

Hadoop初识,

Hadoop初识, 写在前面 本文带你更好了解hadoop的一些知识。 Hadoop概述 Hadoop官方网站是:http://hadoop.apache.org/ 名称由来? Hadoop这个名称其实没有实际意义,只是hadoop作者小孩的一个大象玩...(发布于2020-02-10 21:52:59)

Hadoop入门,

Hadoop入门, Hadoop入门(基于mac) ·Hadoop安装与配置 由于使用mac电脑进行Hadoop操作,我讲使用Vmware Fusion虚拟机进行操作。首先需要在电脑上下载好Vmware Fusion虚拟机和linux系统镜像文件...(发布于2020-02-10 21:52:54)

hadoop 倒排索引,

hadoop 倒排索引, 原文:http://blog.csdn.net/ludengji/article/details/6872664 [java]  view plaincopy 倒排索引是文档检索系统中最常用的数据结构,被广泛的应用于全文搜索引擎。它主要用来存储某个...(发布于2020-02-10 21:52:49)

Hadoop的序列化,

Hadoop的序列化, 1、对象的序列化:将对象编码成一个字节流,以及从字节流中重新构建对象。 2、java内建的序列化机制       在Java中,只需要在类声明中加入 implements Serializable即可...(发布于2020-02-09 21:50:47)

HADOOP生态系统,

HADOOP生态系统, 1、Hadoop生态系统概况 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。 下图为...(发布于2020-02-09 21:50:43)

windows安装hadoop,

windows安装hadoop, hadoop是什么就不多说了,看这里 hadoop推荐部署环境是在linux,但是我们想要在windows体验一下还是可以的,follow me   我的环境:windows xp,hadoop安装包(0.20.1),cygwin    ...(发布于2020-02-09 21:50:40)

Hadoop(MapReduce),

Hadoop(MapReduce), 一、MapReduce定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自...(发布于2020-02-09 21:50:36)

Linux安装Hadoop,

Linux安装Hadoop, Linux安装Hadoop 1.安装前的注意的事项 2.使用Xftp5工具将Hadoop导入到opt目录下面的software文件夹下面 3.解压 4.配置Hadoop环境 1.安装前的注意的事项 1.查看是否安装了Hadoop:...(发布于2020-02-09 21:50:32)