VM NetWorker服务器每晚都会丢失硬盘驱动器

在ESXi主机上运行的Server 2008 R2 w / sp1 VM上运行EMC NetWorker服务器。 VMDK与我们组织运行的所有其他VM服务器的VMDK一起存储在VNXe计算机上。 没有其他的虚拟机有这个问题:

每周晚上9点半以后的每个晚上,服务器都会丢失硬盘。 在早上检查系统,我发现这台机器在尝试PXE之后就处于启动提示状态,并报告找不到可启动的设备。 检查虚拟机设置我发现没有硬盘驱动器连接到机器。

恢复操作非常简单,只需将新的硬盘驱动器分配给系统,并将其指向仍位于VNXe上托pipe的数据存储上的现有VMDK即可。

vSphere服务器不报告任何错误或任何错误。

在服务器本身的系统日志中没有任何信息,所以我很确定它不知道发生了什么事情。

这个问题始于我开始使用NetWorker系统加速备份,添加新的主机进行备份。 目前,我仅使用内置在NetWorker服务器中的已configurationVADP代理以及使用本机已安装的NetWorker客户端的testingSQL服务器(也是VM)备份虚拟主机。 我自己备份了NetWorker服务器,因为文档中提到的应该没有问题,但在发现此问题后不久就会禁用该备份。

我需要找出VMDK如何以及为什么会从NetWorker服务器上脱离。 如果有人明确地告诉我,那将会很好,但是也许可以帮助查找显示系统中所有内容的vSphere日志,这是一个正确的方向。

更新:其他细节

VM的备份计划于每晚晚上9点开始。

从该虚拟机的vSphere日志中:

  • 2/21 at 9:00:11 pm:任务:创build虚拟机快照。
  • 2/22 at 2:18:57 am:任务:删除快照。 这是这个VM FROM自己的第一个尝试定时备份,并指出备份系统的成功和正确的操作。
  • 2/22:我将计算机迁移到其他ESXi主机(HAconfiguration中有三个相同的主机)以更好地排列资源。
  • 2/22 at 9:00:15 pm:任务:重新configuration虚拟机。 这是第一次从虚拟机中移除硬盘。
  • 2/23上午8时25分左右:检查系统,我发现第一次在这台虚拟机上的硬盘丢失。 这使我相信由NetWorker定时备份触发的快照操作正在被ESXi主机转换为“从该VM中移除硬盘”。
  • 2/23 at 9:00:14 pm:任务:重新configuration虚拟机。
  • 2/24我重新连接了HDD,并在NetWorker中禁用了此VM的所有计划备份。
  • 2/24 at 9:31:32 pm:Task:重新configuration虚拟机。
  • 2/25 at 9:00:15 pm,2/26 at 9:00:11 pm:相同的重新configuration虚拟机任务将从该VM中移除HDD。 我第二天早上就把它重新装上。

基于这个日志,我需要检查以下内容:

  • 虚拟机运行在不同的主机上时问题是否会持续存在?
  • 当没有备份运行时问题是否持续?

我会检查这些并报告成功或失败。

更新2:故障排除报告

还有一件事我发现:在NetWorker中的每个VM客户端的configuration中,有一个地方可以loggingVM所在的ESXi主机。 当我将VM移动到不同的ESXi主机时,即使在NetWorker中启用VM自动检测,该值也不会更新。 所以我将VM客户端configuration中的这个值更新到了当前的ESXi主机。 如果AutoDetect自己保持更新,那将会很好。

所以,要报告我昨天试过的故障排除:

首先,硬盘今天早上还在连接,这证实至less是由NetWorker触发的。 我昨天禁用了所有备份,并将NetWorker服务器移至新的ESXi主机。 我还更新了上一段中提到的ESXi主机信息。

今天,我已经重新启用了大部分备份(远离SQL和Exchange等高可用性系统。

如果今晚移除了硬盘,那么这就是备份configuration。

如果今晚HDD未被移除,则是主机configuration信息或主机本身引起的问题。

更新3:疑难解答跟进

HDD昨晚再次丢失,这意味着问题可能是NetWorker的configuration。

回顾一下:昨天晚上,我运行了几个虚拟机(但不是NetWorker服务器)的计划备份,晚上9点之后,我看到了问题中前面提到的相同的日志条目,导致不再是与VM。

还有一件事我会尝试:基于EMC文档,NetWorker服务器也可以是存储节点,大多数虚拟机正在通过此节点处理备份(这与VADP是分开的)。 我将通过节点备份来禁用这些备份,并查看是否有所作为。

此外,物理系统备份和NAS /networking驱动器的NDMP备份工作正常。

我将开始隔离虚拟机,并一次添加一个到备份,看看我能否确定一个特定的虚拟机是否造成这个问题。 这是我应该能够在工作时间testing的东西。

更新:testing发光

好的,问题是每当我尝试使用VADP备份虚拟机时。

我testing了使用各种设置排列来备份正在运行和closures的VM,而关于NetWorker服务器是否丢失其驱动器的唯一决定因素是我是否已经在目标VM上安装了NetWorker客户机,并且正在使用NetWorker客户端或使用VADP。

使用客户端向导configuration备份时,首先select是configuration新的VADP代理,还是VM备份客户端或NetWorker客户端。

如果select虚拟机备份客户端,则可以select是使用VADP(这是默认设置)还是使用安装在虚拟机上的NetWorker客户端进行备份(如果需要任何特殊configuration进行备份,VADP命中实际的VMDK并与VMWare集成,NetWorker仍然“知道”客户端是虚拟机,但可以用来指定特定的驱动器,VSS和其他function,VADP在不使用任何客户资源的情况下备份虚拟机,完全依靠ESXi主机NetWorker客户端软件使用客户端资源来运行备份。

因此,运行VM主机的VADP备份就是从NetWorker服务器中删除硬盘。 当硬盘被丢弃时,vSphere客户端中会显示更多日志条目:

  • 启动VADP代理备份大约20秒后,vSphere会报告尝试将NetWorker服务器从VM2迁移到VM2
  • 那么NetWorker服务器将重置
  • 那么一个事件就说明“已经获得了一个types的票据”
  • 那么会有一个关于分配给虚拟机的video内存的警告
  • 最后是NetWorker服务器虚拟机已启动的报告。

它可能为时已晚,但这可能有助于未来的规划。

发生这种情况的原因使用HotAdd传输模式备份作为备份代理的虚拟机后,备份成功完成,但在清理期间,常规虚拟磁盘与HotAdded磁盘一起被错误地删除。

当时是VDDK套件的已知问题 – http://www.vmware.com/support/developer/vddk/VDDK-1.2.1-Relnotes.html 。 在构buildhotadd环境时,非常重要的是不要使用VADP备份代理。

该解决scheme最终完全重build了NetWorker服务器,由于几个原因,这是一件好事。

现在正在运行备份,NetWorker服务器/ VADP代理的驱动器不会被丢弃。