重新启动后,BIND无法parsing任何.org或.info域名

尝试在BIND服务器本身(CentOS 6.2服务器)上parsing,dig会为.org或.info tld中的任何域返回一个空的“A”logging。 #dig @localhost text-lb.eqiad.wikimedia.org

; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.10.rc1.el6_3.2 <<>> @localhost text-lb.eqiad.wikimedia.org ; (2 servers found) ;; global options: +cmd ;; Got answer: ;; ->>HEADER<<- opcode: QUERY, status: SERVFAIL, id: 58440 ;; flags: qr rd ra; QUERY: 1, ANSWER: 0, AUTHORITY: 0, ADDITIONAL: 0 ;; QUESTION SECTION: ;text-lb.eqiad.wikimedia.org. IN A ;; Query time: 156 msec ;; SERVER: 127.0.0.1#53(127.0.0.1) ;; WHEN: Tue Jan 7 06:26:24 2014 ;; MSG SIZE rcvd: 45 

但是,当我tcpdump的端口,这是我看到在转储(我实际上已经通过所有的CNAME东西首先涉水,我没有包括):

 06:24:20.772293 IP services1i.box11.org.46014 > ns1.wikimedia.org.domain: 65338% [1au] A? text-lb.eqiad.wikimedia.org. (56) 06:24:20.864571 IP ns1.wikimedia.org.domain > services1i.box11.org.46014: 65338*- 1/3/5 A 208.80.154.224 (202) 

这显然是返回一个Alogging的域,但输出不包括Alogging。 当我查询谷歌DNS的一切工作(当然):

 # dig @8.8.8.8 text-lb.eqiad.wikimedia.org ; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.10.rc1.el6_3.2 <<>> @8.8.8.8 text-lb.eqiad.wikimedia.org ; (1 server found) ;; global options: +cmd ;; Got answer: ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 17362 ;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0 ;; QUESTION SECTION: ;text-lb.eqiad.wikimedia.org. IN A ;; ANSWER SECTION: text-lb.eqiad.wikimedia.org. 3489 IN A 208.80.154.224 ;; Query time: 61 msec ;; SERVER: 8.8.8.8#53(8.8.8.8) ;; WHEN: Tue Jan 7 06:26:16 2014 ;; MSG SIZE rcvd: 61 

我不相信我改变了任何configuration,但是这在重新启动之后开始发生,所以可能有一些奇怪的configuration改变潜伏在周围(我已经重新命名了几次,没有任何问题,我敢肯定,自从重新启动命名后,改变了任何configuration)。

我没有得到这里是为什么服务器似乎是要求的Alogging,它似乎得到一个答案,但没有返回到客户端的答案。 查询日志显示这一个孤独的条目:

 07-Jan-2014 06:30:59.766 client 127.0.0.1#60966: view internal: query: text-lb.eqiad.wikimedia.org IN A + (127.0.0.1) 

这是一个示例域,任何.org或.info都会出现同样的问题。 奇怪的是,COM似乎工作得很好。

感谢Nick的定位。 没有日志条目帮助,但是在侦听服务器之后,我发现禁用dnssec明确地导致服务工作。 然后我看了看系统上​​的时间和date,发现离开轨道差不多有一个小时了。ntpd没有启动,而且时钟偏移了一些。 将时钟同步到正确的时间允许BIND正确地返回Alogging。 我将dnssec设置恢复到原来的状态(接受默认设置),系统继续工作。

所以…分辨率是同步时钟,所以这是接近准确的时间。