Yarn架构配置 【mapred-site.xml.temple配置】 先重命名为mapred-site.xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> # 指定mapreduce基于yarn运行 </property> </configuration> 【yarn-site.xml配置】 <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> # 指定mapreduce的时候使用shuffle过程 </property> <property> <name>yarn.resourcemanager.hostname</name> <value>dong-01.cym.com</value> # 指定resourcemanager所在服务器主机名 </property> </configuration> 启动: sbin/yarn-daemon.sh start resourcemanager sbin/yarn-daemon.sh start nodemanager 本地访问:dong.cym.com:8088
sbin/yarn-daemon.sh start resourcemanager sbin/yarn-daemon.sh start nodemanager
bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /test.txt /output
【MapReduce historyserver】 1、历史服务器:查看已经运行完成的应用记录 修改mapred-site.xml 指定historyserver的地址,内部和外部通信端口号,如果不指定默认是本机 historyserver是一个轻量级的服务,可以部署在任意一台节点上 2、配置(在mapred-site.xml中): 注意:这里的端口号不能随便修改 <property> <name>mapreduce.jobhistory.address</name> <value>bigdata-04:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>bigdata-04:19888</value> </property> 启动:sbin/mr-jobhistory-daemon.sh start historyserver 【日志聚合功能】 1、修改yarn-site.xml 指定开启聚合功能 指定日志存放在HDFS上的时间期限,一般建议3-7天左右,存放在HDFS的/tmp/用户之下 <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>106800</value> </property> 2、重启yarn进程
不配置,那么yarn上的history点击无法显示
/opt/apps/hadoop-2.7.3/sbin
目录下写两个脚本start-all-self.sh和stop-all-self.sh添加可执行权限
关闭服务
开启服务
还需要开始日志服务
sbin/mr-jobhistory-daemon.sh start historyserver
重新跑一个任务,查看日志
如果还有问题,检查下服务器防火墙有没有关闭
bin/hdfs dfs -chmod -R 777 /tmp