ESXi 4.0来宾locking

我在带有64位Xeon处理器的HP Proliant g5上安装了ESXi 4.0,并利用免费许可证在公立学校工作。 我从零开始创build了两个server 2003实例,一个是DC,DHCP,另一个是文件服务器和DNS / DHCP备份。 我有两个客人,并运行良好,设置我的用户帐户,传输数据等

一旦我join到域的客户端机器,我会发现,我的两个Windows客人将locking。 有时候是一夜之间,五分钟左右。 “locking”状态意味着,据我所知,所有服务都停止了; DHCP不再分发IP,DNS停止工作,我不能RDP到服务器。 ESXi主机(我的HP服务器)仍然运行正常。 VSphere正在工作,我可以看看个别客人的performance。

我会尝试从VSP里面closures主机,主机开始关机,但是会停留在95%,并保持这种状态,有时候只有10分钟,其他的几个小时。 有几次,我不得不从它的控制台重新启动ESXi以重新启动我的机器。

现在,有谁能告诉我发生了什么,我该如何解决这个问题,或者采取措施来防止这种情况发生? 我聘请了一位顾问来看看,我相信有经验和知识的人,他告诉我,他从来没有见过这样的事情。 他和一个VMauthentication的朋友说话,他也说他从来没有听说过这个问题。 感谢您的回复,我会尽我所能来尽快回复。 目前,服务器已closures,我已经重新安装了九年前的Server 2000服务器,而且我正在考虑安装ESXi 3.5。 有谁知道在4.0中创build的主机将在3.5中工作? 我真的想避免重build这些帐户! 我知道4.0在这个服务器上的作品,因为我有另一个学校的另一台服务器与运行4.0罚款相同的确切硬件。

  • 布伦丹

这对我来说似乎是一个硬件问题,例如坏的内存。 尝试为您的服务器模型运行脱机诊断光盘(如果您还没有,可以从hp.com下载ISO)

日志显示什么? 那么来自VSphere的虚拟机的networking活动呢?

我接下来要做的就是安装某种数据包嗅探器,如果日志中没有任何东西出现的话。 如果系统完全响应,您可以尝试在系统正常运行时运行wireshark,看它是否会在放慢或locking之前更新屏幕。 也许从sysinternals运行tcpmon可能会提供一些线索。

否则,请尝试使用Linux设置一个虚拟机,并通过它指示虚拟机(或redirect来自虚拟机的networkingstream量),以查看使用wireshark可以看到的内容。

如果networkingstream量疯狂,您可能需要find一些方法来嗅探正在发生的事情; 如果这只是一个名称冲突或某种AD复制问题,它将在日志中。

当networking上出现严重的备份过程时,我们会看到降级,但是您没有提及复制文件或类似的任何内容。

这是可行的在你的情况?

发生这种情况时,可以看看主机上的控制台(不知道ESXi是否提供了控制台),并查看过程是否孤立。 如果虚拟机的进程是孤立的,那么您将不得不重新启动主机来清除进程。

我已经在ESX 3.5和4.0上看到过这种情况。 如果客人是从3.5升级,那么您需要确保硬件版本已经升级,以及客户端工具。 我假设你在客人上安装了客户端工具?

我没有理由怀疑存在兼容性问题,但是您是否已经检查了服务器本身以及所有组件硬件(特别是NIC,在我看来有很多与NIC有关的问题),以便与ESXi 4 VMware HCL兼容?

这是一个双核CPU吗? 你是如何configuration虚拟机的,你为每个虚拟机select了多less个vCPU? 我知道一个事实,即如果您在每台机器上select了1个以上的vCPU,则3.5在启动时间方面存在问题,无论如何您并没有真正获得任何性能。

过去我遇到过一些情况:组策略中的某些事情导致机器周期性地被locking(在我的情况下,它将Vista特定的GPO用于电源pipe理,用于Win 7机器IIRC),所以我build议快速查看看看是否join域名已经造成了一个微妙的问题。

检查以下内容:

  • 当前在guest虚拟机上保持打开任何快照? DC上的快照并不是一个好主意,但通常长时间打开快照会导致VMlocking,特别是在DC SQL和Exchange服务器上。

  • 任何不寻常的硬件连接到虚拟机如软盘,USB直通或串口? 将设备剥离到您需要的绝对最小值。

  • 在服务器的硬件上运行一套testing。 在惠普的G5智能手机上有一个体面的套件。 如果您仍然有硬件支持,请致电惠普,看看他们的支持人员是否有任何build议(他们很好,国际海事组织)。

  • 如果你有一些可用的话,用另外一组交换RAM棒。

运行的虚拟机是什么types的磁盘? SAN还是本地? 股票控制器,还是一个离散的? 你排除了安装媒体的问题吗?

编辑:只记得…检查主机服务器上的网卡设置。 我依稀记得在主机网卡上启用了一个NICfunction(TCP卸载?),并且需要在ESX 4.0中禁用它。

我有上面的相关问题(ESXi 4),但它只发生在第三个虚拟机挂起,不能关机,但坚持在95%。 注意到这个问题是由于SEP10造成的,但是与赛门铁克一起安装的第一个和第二个虚拟机没有第三个问题。 删除虚拟机重新安装,它仍然是一样的,始终是第三虚拟机。