2008R2 DHCP服务器变得无法响应

在2013年底,我们单台Windows Server 2008R2 DHCP服务器每周开始无响应一次。 服务器本身已启动,但DHCP服务器没有响应。 试图连接到pipe理界面会挂起,永远不会超时,并尝试从services.msc重新启动服务也将挂起。 没有条目被写入dhcp日志,并且在任何事件日志中没有任何帮助。 我阅读了几篇有关类似问题的微软kb文章,并安装了我发现的hotpatch,但没有一个帮助。 在发生这种情况几周之后,每次都会popup整个服务器来解决问题,我们将大部分范围迁移到了第二台服务器上,尽pipe这并没有解决我们的问题,但确实缓解了这个问题。 这个问题从来没有出现在该服务器上,并且大多数作用域被迁移,它仍然服务于500+的范围内的DHCP租约。 当时我们推断,虽然对Windows DHCP服务器的容量没有正式的限制,也许我们曾遇到某种与我们在任何时候租用的数量相关的竞争条件。

前两天同样的事情发生在第二台服务器上,今天早上又发生了。 当周一发生的时候,我不在办公室,所以Linuxpipe理员反弹了整个服务器(这是以前唯一帮助的)。 今天早上发生的时候,我在线,所以我跳了进去。尝试所有我们在2013年尝试的事情后,我用taskmanager强制杀死运行dhcpserver的svchost,然后能够使用services.msc重新启动服务。 然后将条目写入到dhcp日志中,指出该服务再次联机,但是它从未开始分发IP。 pipe理界面在这一点上也是有响应的。 经过近一个小时的摸索,我不得不重新启动服务器,让进来开始一天的人不会感到不便。

我们没有添加任何新的范围,也没有以任何重大的方式改变networking,我可以看到会导致问题出现。

在这一点上,我希望find一种方法来增加DHCP服务器的日志logging,虽然我想知道是否它是超过DHCP服务器服务造成这个问题,因为我能够强制杀死它,并重新启动它,它写到审计日志,但没有其他事情发生过。

这些服务器正在运行卡巴斯基AV和所有我在网上find的DHCP服务器排除在外(这基本上不包括dhcp文件夹),但我今天早上卸载它,看看是否有所作为。

服务器大多是修补程序,它不是100%最新,但它是非常接近。

思考? build议?