Hadoop:如何configuration数据节点的故障转移时间

如果数据节点出现故障,我需要在HDFS集群上重新复制块。 事实上,这似乎已经发生了10分钟的时间。 但是,我想减less这个时间,但想知道如何去做。

我试图设置dfs.namenode.check.stale.datanode但没有任何大的成功。 那么什么是configuration选项或什么是我可以调整在这里可能会减less到1分钟的选项?

hdfs-site.xml的完整部分看起来像这样

 <property> <name>dfs.namenode.check.stale.datanode</name> <value>true</value> <description>Activate stale check</description> </property> <property> <name>dfs.namenode.stale.datanode.interval</name> <value>10</value> <description>Timeout</description> </property> 

基于对hadoop-user-mailing-list的讨论,似乎需要在hdfs-site.xml设置dfs.namenode.heartbeat.recheck-interval 。 数据节点被标记为死的时间是从这个时间结合dfs.heartbeat.interval计算出来的。 实际上是一个configuration

 <property> <name>dfs.namenode.heartbeat.recheck-interval</name> <value>10000</value> </property> 

导致〜45s,直到节点被标记为死亡。 (这适用于Hadoop的2.6)