服务器 Gind.cn

服务器问题集锦,包括 Linux(Ubuntu, Centos,Debian等)和Windows Server服务器

当DNS服务器失败时避免DNS超时

我们有一个小型的数据中心,有大约100个主机指向3个内部DNS服务器(绑定9)。 当其中一个内部DNS服务器变得不可用时,我们的问题就出现了。 那时,指向该服务器的所有客户端开始执行的速度非常缓慢。 问题似乎是股票的Linuxparsing器没有真正的“故障转移”到不同的DNS服务器的概念。 您可以调整它使用的重试的超时时间和次数(并且设置为旋转,以便它可以通过列表工作),但是如果主DNS服务器不可用,无论使用我们的服务的设置的执行速度要慢得多。 目前,这是我们服务中断的最大来源之一。 我的理想答案是像“RTFM:调整/etc/resolv.conf这样…”,但如果这是一个选项,我没有看到它。 我想知道其他人怎么处理这个问题? 我可以看到3种可能的解决scheme: 使用linux-ha / Pacemaker和故障切换ips(因此dns IP VIP“始终”可用)。 唉,我们没有一个好的击剑基础设施,没有击剑起搏器不能很好地工作(根据我的经验,Pacemaker降低了击剑的可用性)。 在每个节点上运行本地dns服务器,并将resolv.conf指向localhost。 这是可行的,但它会给我们更多的服务来监视和pipe理。 在每个节点上运行本地caching。 人们似乎认为nscd“破碎”,但dnrd似乎有正确的function设置:它将dns服务器标记为up或down,并且不会使用“down”dns服务器。 任何转换似乎只在ip路由级别工作,并依赖于路由更新服务器故障。 多播似乎是一个完美的答案,但绑定不支持广播或多播,我能find的文档似乎表明,多播DNS更多的目的在于服务发现和自动configuration,而不是常规的dnsparsing。 我错过了一个明显的解决scheme?