专栏名称: 36大数据

关注大数据和互联网趋势，最大，最权威，最干货的大数据微信号（dashuju36)。大数据第一科技媒体。不发软文，只做知识分享。

零基础搭建Hadoop大数据处理-集群安装

36大数据 · 公众号 · 大数据 · 2017-05-14 08:02

正文

经过一系列的前期环境准备，现在可以开始Hadoop的安装了，在这里去apache官网下载2.7.3的版本 http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

不需要下载最新的3.0版本，与后续Hive最新版本有冲突，不知道是不是自己的打开方式不对。

hadoop有三种运行方式：单机、伪分布式、完全分布式，本文介绍完全分布式。

安装Hadoop

现在有三个机器，一个Master H32，两个Slaver H33、H34。

将下载的压缩包上传到解压并移动至Master机器的相应目录。

将软件放置/usr/local目录下：

tar -zxvf hadoop-2.7.3.tar.gz
mv hadoop-2.7.3 hadoop273

创建hadoop用户组和用户

[root@H32 local]# groupadd hadoop #添加hadoop组
[root@H32 local]# useradd -g hadoop hadoop -s /bin/false

将该hadoop文件夹的属主用户设为hadoop

sudo chown -R hadoop:hadoop /usr/local/hadoop273

  配置文件之前先大体介绍一下hadoop2目录中的各个文件夹，注意区分与Hadoop1中的改变。

外层的启动脚本在sbin目录
内层的被调用脚本在bin目录
Native的so文件都在lib/native目录
配置程序文件都放置在libexec
配置文件都在etc目录，对应以前版本的conf目录
所有的jar包都在share/hadoop目录下面

创建Hadoop数据目录：

mkdir -p /usr/local/hadoop273/hdfs/name
mkdir -p /usr/local/hadoop273/hdfs/data

若不配置，Hadoop默认将数据存储在tmp文件夹中，重启会清空tmp数据，因此单独配置其数据存储文件夹，具体使用配置在下面XML中。

配置环境变量

/etc/profile 增加如下内容：

export HADOOP_HOME=/usr/local/hadoop273
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export HADOOP_MAPARED_HOME=${HADOOP_HOME}
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_HDFS_HOME=${HADOOP_HOME}
export HADOOP_YARN_HOME=${HADOOP_HOME}
export YARN_HOME=${HADOOP_HOME}
export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HDFS_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export LD_LIBRARY_PATH=${HADOOP_HOME}/lib/native/:$LD_LIBRARY_PATH
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"

执行执行source /etc/profile，使之生效

修改slaves文件，添加子节点服务名或IP

$HADOOP_HOME/etc/hadoop/slaves （Master主机特有，子节点可以不加）

H33 
H34

 或写对应的IP

192.168.80.33

192.168.80.34

hadoop-env.sh中配置java_home

export JAVA_HOME=/usr/local/java/jdk1.8.0_101

让环境变量配置生效source

source /usr/local/hadoop3/etc/hadoop/hadoop-env.sh

Hadoop配置文件在conf目录下，之前的版本的配置文件主要是Hadoop-default.xml和Hadoop-site.xml。

由于Hadoop发展迅速，代码量急剧增加，代码开发分为了core，hdfs和map/reduce三部分，配置文件也被分成了三个core-site.xml、hdfs-site.xml、mapred-site.xml。

core-site.xml和hdfs-site.xml是站在HDFS角度上配置文件；core-site.xml和mapred-site.xml是站在MapReduce角度上配置文件。

core-site.xml配置如下（经过多次坑最后能稳定跑的配置，说多了都是泪）



  fs.default.name
  hdfs://H32:9000


hadoop.tmp.dir
/usr/local/hadoop273/hadoop_tmp


hadoop.proxyuser.root.hosts
*


hadoop.proxyuser.root.groups
*


hadoop.proxyuser.sqoop2.hosts
*


hadoop.proxyuser.sqoop2.groups
*

单独创建tmp文件夹hadoop_tmp 给 hadoop.tmp.dir 用于跟普通数据隔离。

hdfs-site.xml



dfs.namenode.secondary.http-address
H32:9001


   dfs.replication
   1


  dfs.tmp.dir
  /usr/local/hadoop273/hadoop_tmp


   dfs.namenode.name.dir
   file:/usr/local/hadoop273/hdfs/name


    dfs.datanode.data.dir
    file:/usr/local/hadoop273/hdfs/data


    dfs.permissions
    false


    dfs.webhdfs.enabled
    true


dfs.datanode.max.xcievers
4096

mapred-site.xml


 
mapreduce.framework.name 
yarn 


mapreduce.application.classpath
/usr/local/hadoop273/etc/hadoop,/usr/local/hadoop273/share/hadoop/common/*,/usr/local/hadoop273/share/hadoop/common/lib/*,/usr/local/hadoop273/share/hadoop/hdfs/*,/usr/local/hadoop273/share/hadoop/hdfs/lib/*,/usr/local/hadoop273/share/hadoop/mapreduce/*,/usr/local/hadoop273/share/hadoop/mapreduce/lib/*,/usr/local/hadoop273/share/hadoop/yarn/*,/usr/local/hadoop273/share/hadoop/yarn/lib/*


mapreduce.jobhistory.address
H32:10020


mapreduce.jobhistory.webapp.address
H32:19888


mapreduce.map.memory.mb
1536


mapreduce.map.java.opts
-Xmx3072M


mapreduce.reduce.memory.mb
3072


mapreduce.reduce.java.opts
-Xmx6144M


mapreduce.cluster.map.memory.mb
-1


mapreduce.cluster.reduce.memory.mb
-1

yarn-site.xml





yarn.resourcemanager.address
H32:8032


yarn.resourcemanager.scheduler.address
H32:8030


yarn.resourcemanager.resource-tracker.address
H32:8031
   

yarn.resourcemanager.admin.address
H32:8033
   

yarn.resourcemanager.webapp.address
H32:8088
  
 
  yarn.nodemanager.aux-services 
  mapreduce_shuffle 
   
 
  yarn.nodemanager.aux-services.mapreduce.shuffle.class 
  org.apache.hadoop.mapred.ShuffleHandler 


mapreduce.application.classpath
/usr/local/hadoop273/etc/hadoop,/usr/local/hadoop273/share/hadoop/common/*,/usr/local/hadoop273/share/hadoop/common/lib/*,/usr/local/hadoop273/share/hadoop/hdfs/*,/usr/local/hadoop273/share/hadoop/hdfs/lib/*,/usr/local/hadoop273/share/hadoop/mapreduce/*,/usr/local/hadoop273/share/hadoop/mapreduce/lib/*,/usr/local/hadoop273/share/hadoop/yarn/*,/usr/local/hadoop273/share/hadoop/yarn/lib/*
 

yarn.nodemanager.vmem-pmem-ratio
3

注意黄色标志，要classpath一定是绝对路径，不要用$HADOOP_HOME，运行会一直提示找不到相关类错误，至此master节点的hadoop搭建完毕。

搭建剩余节点

现在在Master机器上的Hadoop配置就结束了，剩下的就是配置Slave机器上的Hadoop。

将 Master上配置好的hadoop所在文件夹”/usr/local/hadoop273″复制到所有的Slave的”/usr/local”目录下（实际上Slave机器上的slavers文件是不必要的，复制了也没问题）。用下面命令格式进行。（备注：此时用户可以为hadoop也可以为root）

把H32的hadoop目录下的logs和tmp删除，再把H32中的jdk、hadoop文件夹复制到H33和H34节点

scp -r /usr/local/hadoop273 root@H33:/usr/local

例如：从”Master.Hadoop”到”Slave1.Hadoop”复制配置Hadoop的文件。

上图中以root用户进行复制，当然不管是用户root还是hadoop，虽然Master机器上的”/usr/local/hadoop273″文件夹用户hadoop有权限，但是Slave1上的hadoop用户却没有”/usr/local”权限，所以没有创建文件夹的权限。所以无论是哪个用户进行拷贝，右面都是”root@机器IP”格式。因为我们只是建立起了hadoop用户的SSH无密码连接，所以用root进行”scp”时，扔提示让你输入”Slave1.Hadoop”服务器用户root的密码。

查看”Slave1.Hadoop”服务器的”/usr/local”目录下是否已经存在”hadoop”文件夹，确认已经复制成功。

hadoop文件夹确实已经复制了，但是我们发现hadoop权限是root，所以我们现在要给”Slave1.Hadoop”服务器上的用户hadoop添加对”/usr/local/hadoop”读权限。

以上配置完成后，将hadoop整个文件夹复制到其他机器。

启动hadoop

1.格式化namenode

hdfs namenode -format 只需一次，下次启动不再需要格式化，只需 start-all.sh
若没有设置路径$HADOOP_HOME/bin为环境变量，则需在$HADOOP_HOME路径下执行

bin/hdfs namenode -format

2.启动dfs及yarn

start-dfs.sh 在启动前关闭集群中所有机器的防火墙，不然会出现datanode开后又自动关闭(暂未发现) service iptables stop

start-yarn.sh

若没有设置路径$HADOOP_HOME/sbin为环境变量，则需在$HADOOP_HOME路径下执行

sbin/start-dfs.sh
sbin/start-yarn.sh
或 直接start-all.sh都启动

另外还要启动history服务，不然在面板中不能打开history链接。

sbin/mr-jobhistory-daemon.sh start historyserver

停止集群

sbin/stop-dfs.sh
sbin/stop-yarn.sh
或 直接stop-all.sh

下面使用jps命令查看启动进程：
4504 ResourceManager
4066 DataNode
4761 NodeManager
5068 JobHistoryServer
4357 SecondaryNameNode
3833 NameNode
5127 Jps

打开监控页面

现在便可以打开页面http://192.168.80.32:8088及http://192.168.80.32:50070；看到下面两个页面时说明安装成功。

测试

hdfs测试：

在root中创建文件：

~/hadoop-test-data.txt

向hdfs中上传文件：

bin/hadoop fs -put ~/hadoop-test-data.txt /tmp/input

查看hdfs文件目录：

hdfs dfs –ls /

移除文件命令：

hadoop fs -rm -r /tmp/input

Yarn测试：

运行WordCount测试程序，output为输出文件。

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /tmp/input output

运行过程出现下面内容，没有错误提示说明正常：

具体查看结果：

查看生成列表，会有两个文件，主要查看part-r-00000

hadoop fs -ls output/

hadoop fs -cat output/part-r-00000

结果显示：

hadoop 1
hello 2
java 4
jsp 1

到这里，hadoop-2环境搭建结束，配置文件根据具体需求，具体配置。

查看集群状态：

[root@H32 hadoop273]$ ./bin/hdfs dfsadmin -report

MapReduce Application Master界面：

Map Task运行状况：

某个Node上各个Container状态：

扩展

以下列布署过程中遇到的几个常见问题，加了网上一些网友的内容。

解决”no datanode to stop”问题

当停止Hadoop时发现如下信息：

原因：每次namenode format会重新创建一个namenodeId，而tmp/dfs/data下包含了上次format下的id，namenode format清空了namenode下的数据，但是没有清空datanode下的数据，导致启动时失败，所要做的就是每次fotmat前，清空tmp一下的所有目录。

第一种解决方案如下：

1）先删除”/usr/hadoop/tmp” rm -rf /usr/hadoop/tmp
2）创建”/usr/hadoop/tmp”文件夹 mkdir /usr/hadoop/tmp
3）删除”/tmp”下以”hadoop”开头文件 rm -rf /tmp/hadoop*
4）重新格式化hadoop hadoop namenode -format
5）启动hadoop start-all.sh

使用第一种方案，有种不好处就是原来集群上的重要数据全没有了。假如说Hadoop集群已经运行了一段时间。建议采用第二种。

第二种方案如下：

1）修改每个Slave的namespaceID使其与Master的namespaceID一致。
2）修改Master的namespaceID使其与Slave的namespaceID一致。