VMWare ESXi 4.0所有VM的随机locking:需要帮助

钻机:

  • 戴尔PowerEdge T610
  • 2个Intel Xeon四核
  • 16GB内存

扣上,准备一个漫长的旅程,这不是一个具体的问题,作为一个无耻的尝试得到一个免费的忍者系统pipe理员,而不是试图雇用一个我听到他们中的一些挂在这些部分:)

所以我在Dell PowerEdge上运行VMWare ESXi 4.0。 我有:

  • Windows Server 2008的6个实例,
  • 1 Windows Server 2003的实例1
  • Ubuntu 10的1个实例和1
  • 1个Windows XP实例。

随机地,通常隔几个星期,所有的虚拟机将会突然停止响应。 我可以使用VSphere Client进行连接,但每个虚拟机的控制台选项卡只是一个空白的黑屏。 在networking上没有响应。

VMWare没有什么可说的,系统日志显示正常没有任何明显的错误。 如果尝试使用VSphere Client重新启动或重新启动任何VM,则通知区域中的值将达到95%,然后…什么也不是。

如果我把键盘和鼠标连接到物理服务器,有一个选项F12重新启动,但是这样做…是的,你什么也没猜到。 我等了20-30分钟,没有任何反应。

我需要敲门学校的人带我,并给我一些关于如何排除故障和隔离这个问题的指针。 我有一个偷偷的怀疑,这可能是与SCSI硬盘驱动器arrays有关,在这种locking发生的时候,提到SCSI的消息经常(但不总是)系统日志中的最后一件事,尽pipeVMWare进行了各种日志logging在这些消息之后的世俗的绒毛,好像没有什么是错的。

我是一个很忙的开发者,尽pipe我很想成为一个有才华的系统pipe理员,不幸的是,我不是非常感谢任何帮助或build议我的虚拟主机问题处理的话。

这是不雅的硬件,某种代码腐败或一个非常奇怪的错误。

我的build议是立即升级到4.1U1,这将确保代码是最新的,并且不会以任何方式损坏 – 如果您的实际虚拟机在不同的磁盘上,我会在更新之前擦除操作系统磁盘。

除此之外,它将成为更换部件的常用技巧,直到您获得稳定 – 至less您怀疑哪个部件可能有问题。

当然,如果您有支持合同,您可以随时致电VMWare和/或Dell。