yarn中的ResourceManger Restart与NodeManager Restart

官网中有关于yarn中的ResourceManger Restart与NodeManager Restart说明: 1. http://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/ResourceManagerRestart.html 2. http://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/NodeManagerRestart.html 我的问题是我对这两种特性不太了解,老师能解释一遍吗?它们在实际的生产环境有什么意义呢?如果我配置了ResourceManager HA,还有必要配置它们吗? 我测试环境的配置代码:
<!-- ResourceManager Restart -->
  <property>
    <name>yarn.resourcemanager.recovery.enabled</name>
    <value>true</value>
  </property>
  <property>
    <name>yarn.resourcemanager.store.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
  </property>
  <property>
    <name>yarn.resourcemanager.am.max-attempts</name>
    <value>3</value>
  </property>

  <!-- NodeManager Restart -->
  <property>
    <name>yarn.nodemanager.recovery.enabled</name>
    <value>true</value>
  </property>
  <property>
    <name>yarn.nodemanager.recovery.dir</name>
    <value>${hadoop.tmp.dir}/yarn-nm-recovery</value>
  </property>
  <property>
    <name>yarn.nodemanager.address</name>
    <value>${yarn.nodemanager.hostname}:45454</value>
  </property>

fish - Hadooper

赞同来自: 亡命天涯

ResourceManager HA保证一个RM挂了之后,另一个可以感知到并启动成为新的active RM。但新的RM需要读取原有RM的关于应用的相关状态,并恢复原来RM在挂掉之前那些还在执行中的任务,这需要依赖Resourcemanager Restart。

要回复问题请先登录注册