hadoop集群启动问题

如图,先启动zookeeper,在启动hadoop,进程都在,在WEB段访问8088出现RM没有active,同时出现的还有namenode都处于standby的状态,重启zk后namenode可以恢复active状态,但是RM还是不行,最近一次操作似乎是初始化的flink,我怀疑zk的高可用没有正常工作,但是查看其日志没有ERROR错误,leader也存在,图中错误是RM的日志信息。希望老师能帮我解决问题,, 谢谢
QQ截图20180323225407.jpg QQ截图20180323225415.jpg QQ截图20180323225148.jpg

fish - Hadooper

赞同来自:

到zk所在的服务器上,netstat看下2181端口在监听状态么?查下zookeeper server的日志中是否有什么异常?

fish - Hadooper

赞同来自:

zk所在服务器是指你启动zk的所有服务器。日志是乱码是否因为你的终端配置的编码方式跟Linux服务器不一致?(比如一个是utf8另一个是unicode)。 2888是zk服务器之间的通信端口,2181是zk clinet链接到zk服务器的端口。

fish - Hadooper

赞同来自:

如果任务申请的内存过大,超出实际物理内存数,会出现在执行任务时由于机器的内存被用用光而触发Linux 的oom killer机制,任务被杀掉。

要回复问题请先登录注册