欢迎投稿

今日深度:

HADOOP 集群搭建,

HADOOP 集群搭建,


目录

  • 1. 集群简介
  • 2. 软件准备
  • 3. 网络配置
  • 4. 系统设置
  • 5. JDK安装
  • 6. HADOOP安装
  • 7. 启动集群
  • 8. 测试试验

1. 集群简介

  HADOOP集群五个节点角色分配如下:

  •   mini1   NameNode            SecondNameNode
  •   mini2   ResourceManager
  •   mini3   DataNode              NodeManager
  •   mini4   DataNode              NodeManager
  •   mini5   DataNode              NodeManager

2. 软件准备

  • vm14;
  • centos6.4-64bit;
  • jdk8,
  • hadoop2.6.4

3. 网络配置

  • 网络为 VMnet8
  • 子网 IP 为192.168.2.0
  • 子网掩码:255.255.255.0
  • 网关 IP 为192.168.2.1

4. 系统设置

  • 添加hadoop用户 ,useradd 命令;
  • 将hadoop用户分配sudoer权限 ,vi /etc/sudoers 命令;
  • 同步时间 ,date -s 命令;
  • 设置主机名 , vi /ect/sysconfig/network 命令, 主机名分别为:mini1,mini2...mini5;
  • 配置内网域名映射,vi /etc/hosts/ 命令,映射为192.168.2.201-205;
  • 配置ssh免密登录,ssh-keygen, ssh-copy-id 命令;
  • 配置防火墙,chkconfig iptables off 命令;

   linux 详细命令请查看本人之前总结博文, https://blog.csdn.net/py_tamir/article/details/88384074

5. JDK安装

请查看本人之前总结博文, https://blog.csdn.net/py_tamir/article/details/88384074   中的 “6软件安装”部分

6. HADOOP安装

  • 上传hadoop安装包2.6.4
  • 安装目录为 /home/hadoop/apps
  • 解压安装包
  • 修改配置文件

修改配置文件为:

A  :  hadoop-env.sh

# The java implementation to use.
export JAVA_HOME=/home/hadoop/apps/jdk1.8.0_161

B:  core-site.xml

<configuration>

<!-- 指定hdfs的namenoded地址-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://mini1:9000</value>
</property>

<!-- 指定hadoop临时目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/apps/hdpdata/</value>
</property>

</configuration>

C : hdfs-site.xml

<configuration>

<property>
<name>dfs.namenode.name.dir</name>
<value>/home/hadoop/data/name</value>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hadoop/data/data</value>
</property>

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

<property>
<name>dfs.secondary.http.address</name>
<value>mini1:50090</value>
</property>

</configuration>

D:  mapred-site.xml

<configuration>
<!-- 指定mr框架为yarn方式 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>    

E: yarn-site.xml

<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>mini2</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

F: salves

mini3
mini4
mini5

软件分发从mini1到mini2-5  

  • scp -r apps/ mini2:/home/hadoop/
  • scp -r apps/ mini3:/home/hadoop/
  • scp -r apps/ mini4:/home/hadoop/
  • scp -r apps/ mini5:/home/hadoop/

7. 启动集群

  • 在mini1机器上,格式化NameNode,命令 bin/hadoop  namenode -format
  • 在mini1机器上,启动hdfs, 命令sbin/start-dfs.sh
  • 在mini2机器上,启动yarn,命令sbin/start-yarn.sh

8. 测试试验(查看进程信息)

 

 

 

 

 

www.htsjk.Com true http://www.htsjk.com/Hadoop/41291.html NewsArticle HADOOP 集群搭建, 目录 1. 集群简介 2. 软件准备 3. 网络配置 4. 系统设置 5. JDK安装 6. HADOOP安装 7. 启动集群 8. 测试试验 1. 集群简介   HADOOP集群五个节点角色分配如下:   mini1   NameNo...
相关文章
    暂无相关文章
评论暂时关闭