几天前,我们偶然发现了一个相对新安装的用于VDI的ESXi 5pipe理主机的令人不安的问题。 我们正在为链接克隆部署准备一个基础虚拟机,当从另一台计算机(“\ vm \ c $”)访问其pipe理共享时,整个pipe理networking都将locking。 我们可以浏览一下,但挖掘了几个文件夹后,资源pipe理器挂起。 主机和其内部的所有其他虚拟机完全无法从vSphere Client中访问。 如果我物理地走到ESXi服务器,我可以login并重新启动,它会恢复正常。 99%的时间,我可以可靠地使用任何基于Windows的虚拟机(7和2008R2)崩溃。 今天,我尝试了服务器上的不同物理端口(有4个),发现一旦它在端口上崩溃,移动到另一个,重新启动pipe理networking让我回来,但如果我远程启动共享,我可以这个端口也崩溃了。 重新启动清除了一切。
我梳理了服务器上的日志,并没有发现任何使用的东西。 有任何想法吗?
在VMware支持大约一个小时之后,我们就深入到了问题的底部。 Broadcom的以太网驱动程序和VMware存在一个已知的问题。 通过禁用NetQ,问题到目前为止已经消失。 浏览networking上的某些文件夹时,我仍然会看到几秒钟的延迟,但最终会加载并不会使网卡崩溃。
~ # esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.00 tg3 Up 1000Mbps Full 24:b6:fd:f6:xxxx 1500 Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet vmnic1 0000:01:00.01 tg3 Down 0Mbps Half 24:b6:fd:f6:xxxx 1500 Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet vmnic2 0000:02:00.00 tg3 Down 0Mbps Half 24:b6:fd:f6:xxxx 1500 Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet vmnic3 0000:02:00.01 tg3 Down 0Mbps Half 24:b6:fd:f6:xxxx 1500 Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet vmnic4 0000:42:00.00 ixgbe Down 0Mbps Half 90:e2:ba:0f:xxxx 1500 Intel Corporation 82599EB 10-Gigabit SFI/SFP+ Network Connection vmnic5 0000:42:00.01 ixgbe Down 0Mbps Half 90:e2:ba:0f:xxxx 1500 Intel Corporation 82599EB 10-Gigabit SFI/SFP+ Network Connection
计算Broadcom / tg3网卡(在我们的例子中是4)。
~ # esxcfg-module -s force_netq=0,0,0,0 tg3
重新启动主机,你就完成了。