备份我的数据会导致我的服务器使用Symantec Backup Exec 12崩溃,或导致我无法访问Irony

我有一台运行Windows Server 2003的Dell PowerEdge 2850,它是我的一个客户的主要文件服务器。 我有另外一台运行Windows Server 2003的服务器,作为Symantec Backup Exec 12的核心介质服务器。

我最近从Backup Exec 11d升级到12.此升级是必要的,因为我们也从Exchange 2003升级到Exchange 2007.升级后,我必须将新版本12 Backup Exec远程代理推送到每台服务器上备份(总共约6个)。 我的5台服务器都做得很好,每天晚上忠实地完成备份。 我的文件服务器经常崩溃。

观察:

  • 当服务器崩溃时,它不是蓝屏,它只是完全locking。 即使鼠标没有反应。 如果您将服务器locking时间足够长,则最终会自行重新启动,并挂在Windows启animation面上。
  • 事件查看器绝对没有任何问题的证据。 日志从日常logging到第二天早上的一个不明原因的关机事件时,我必须硬重置服务器才能启动。
  • 90%的时间服务器不能干净地启动,它挂在Windows启animation面上。 我没有任何光在这里stream走。 当服务器挂起我所能做的就是硬重置它,然后重试。 即使成功启动和chkdsk / r操作后,如果重新启动机器,您有90%的机会不会干净地备份。

后面的故事:

这台服务器在一个月前的夜间备份期间开始崩溃。 我尝试了所有我能想到的方法来解决问题,最终不得不放弃,因为我无法在凌晨4点到办公室来尝试让服务器重新联机。 一个星期五我很幸运,服务器保持完整备份。 我借此机会将完整备份恢复到我设置的临时服务器,并将所有用户切换到临时服务器。 然后我重新加载了生病的文件服务器。

我将所有的用户保留在临时文件服务器上大约3周。 我在常规文件服务器上使用的临时服务器上安装了相同的Backup Exec Remote Agent和趋势科技A / V客户端。 在这期间,我完全没有问题备份临时服务器。

我广泛testing了重新加载的文件服务器。 我每天一个小时重新启动一次服务器,连续3个星期试图让它失败。 它从来没有。 我感到自信,重装是我的问题的答案。 我将所有数据从临时服务器移回到常规服务器。 在它再次locking之前,我得到了3次夜间备份,并开始了熟悉的失败启动干净的行为。

这个周末我决定通过整个备份工作来监视文件服务器。 我将RDPd放入文件服务器,并且还放入运行Backup Exec的服务器中。 在文件服务器上,我打开了任务pipe理器,以便查看进程并观察CPU和内存的使用情况。 一切运行顺利,大约60GB的备份。 然后我注意到Backup Exec中备份作业的字节数已经停止了。 我回头看看我的RDP会话进入文件服务器,我得到了关于CPU和内存使用情况的实时更新 – 几乎为0%,这是不寻常的。 备份通常在备份作业期间徘徊在40%左右。

让我重申这一点: 屏幕清爽,我得到实时的任务pipe理器更新 – 直到我点击开始菜单。 屏幕变黑,服务器locking。 事实上,我认为服务器已经locking了,显卡还没有弄清楚。

我回到了自己的诀窍中:在Windows启animation面挂起时,开车到办公室,一次又一次地重新安装服务器。 我做了2个小时没有得到一个成功的启动。 我开始恐慌,因为我没有一个体面的备份来使所有的东西都回到工作的临时文件服务器上。

一旦我耗尽了我所知道的一切,我深吸一口气,启动到Windows Server 2003光盘,并执行Windows的修复安装。 服务器恢复正常,我的所有数据完好无损。 我现在可以随意重新启动服务器,它会恢复干净。 问题是,只要我试图再次将这些数据备份起来,我就会回到原点。

所以,让我总结一下:

以下是我迄今为止对此服务器进行故障排除所做的工作:

  1. 删除并重新创buildRAID 5集。 初始化驱动器。 用新的Server 2003安装重新加载服务器。
  2. 戴尔证实,我已经安装了最新的,戴尔批准的BIOS和NIC驱动程序。
  3. 卸载/重新安装Backup Exec Remote Agent。
  4. 卸载趋势科技A / V客户端。
  5. configuration服务器不要在蓝屏后自行重启,这样我可以看到任何停止错误。 我曾经认为服务器是蓝屏,但是由于我启用了这个设置,我现在知道服务器完全locking了。
  6. 从Windows故障恢复控制台运行chkdsk / r。 几个错误被发现和纠正,但没有帮助我的问题。

帮助确认或否认以下假设:

  1. 这里工作有两个问题。 为什么服务器首先被locking,为什么服务器在locking之后不能干净地启动。
  2. 这最终是一个软件问题。 服务器工作正常,可以整天干净地重新启动 – 直到第一次locking – 在新的操作系统负载甚至修复安装之后。
  3. 一般来说,这不是Backup Exec的问题。 我所有的其他服务器备份都很好。 为了logging,所有其他服务器运行Server 2003,其中一些服务器比这里讨论的文件服务器容纳更多的数据。

任何帮助表示赞赏。 讽刺是几乎无法承受的。 备份我的数据是危害它的。

在Windows启animation面悬挂使我相当怀疑你的RAID控制器固件或驱动程序。 这是一个戴尔PERC? 你目前的固件和驱动程序?

最后几个文件和目录是否有特殊的成功备份(即备份文件到目前为止没有特征)?

您可以在文件服务器上的Backup Exec远程代理中打开debugging日志logging,但如果文件系统或磁盘驱动器崩溃并崩溃,则可能无法获得写入的debugging日志。 停止远程代理服务,并使用服务属性的“启动参数”文本框中指定的“-debug”参数来启动它(假设您正在使用“服务”MMCpipe理单元来执行此启动/停止操作) 。 如果您更喜欢将“-debug”设置为永久性,请将其添加到“HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ Services \ BackupExecAgentAccelerator”中的ImagePath值。

2011年11月发布 – 试试这个:

1)右键单击文件C:\ program files \ symantec \ SYMEVENT.SYS,然后select“属性”>“版本”(选项卡),并注明版本信息。

2)下载SymEvent安装程序/更新程序: ftp : //ftp.symantec.com/public/english_us_canada/symevnt/Sevinst.exe

3)按照以下文章更新SymEvent: http : //www.symantec.com/business/support/index? page=content& id= TECH98521

摘抄:
要更新Windows 2003 / XP / 2000 / NT(包括服务器版本)上的Symevent文件,请执行以下操作:
A.从Symantec FTP站点下载Sevinst.exe。 将文件保存到硬盘上的文件夹。
B.打开一个命令提示符,然后转到您下载Sevinst.exe文件的文件夹。
C.根据程序版本,执行以下操作之一:

  • 在运行Symantec AntiVirus 9.x 或更高版本的计算机上,键入以下命令:
    sevinst.exe / log SAVCE

  • 在运行Symantec AntiVirus 8.x 或更低版本的计算机上,键入以下命令:
    sevinst.exe / log NAVNT

D.重新启动电脑

我有一个与Backup Exec类似的问题(虽然,更老的版本10),我安装了最新的更新,我的服务器随机启动BSODing在定时备份或稍后。 我从来没有确定问题的确切原因,但它似乎都与趋势科技也有一定的关系,并一起引起内存保护错误。

我的解决scheme是恢复到更高的Backup Exec版本以及更新我的TrendMicro(如果您使用的是officecane,最近有一个新的主要版本)。

记住你没有提到testing的唯一的东西是RAM和系统负载水平。

内存应该很容易,但是我不确定是否有任何关于备份的内容会导致使用一个在常规使用中不会被触发的坏区域 – 它不适合。

另一件事是硬件上的负载水平。 备份时,将从磁盘和网卡上移动大量信息。

  • 您已经有一个检查RAID控制器的build议; 我想补充一点,通过尝试模拟备份的负载进行一些大容量传输来检查它。 另外,它是否在备份开始或经过一段时间的持续吞吐量后死亡?

  • 对于网卡的负载,我会尝试一些东西 – 另一个网卡,强制它下降到100MBit,推动大量的数据(再次,模拟备份负载)。

testing这些最大的麻烦最终可能是单独testing它们。 我将以NIC(s)作为最简单的项目来testing。 如果您可以将一个或多个额外的驱动器放入独立于RAID控制器的系统中,那么可以为您提供一种很好的方法来隔离RAID控制器本身是否是问题的根源 – 将所有内容复制到非RAID驱动器,然后查看是否你可以干净地支持这些。

对于第一个之后的继续/重复locking – 完全切断系统电源解决问题? 请记住,closures服务器并不是完全closures – 尤其是networking接口可能保持在LAN唤醒状态。 如果硬件中某些内部状态不正确,重新启动可能不会真正清除它。

我会怀疑司机问题。 只是一个类似的经验。 传统应用使用ISDN调制解调器。 我把它移到一台新电脑上,下载了最新的调制解调器驱动

ISDN连接不断下降,我认为这是调制解调器/线…但毕竟search我取代了最新的驱动程序6(!)年,从那时起,它没有任何问题。 所以最新的驱动程序并不总是最好的 – 如果没有被破坏,不要修复。

祝你好运!

这可能是一个开放的文件问题,打开的文件可能会被损坏。 尝试支持除了Windows(和以下)目录之外的所有东西。 看看是否备份数据冻结了吸盘。 另外,如果您有磁盘空间,使用NT备份执行磁盘到磁盘备份,则将该文件备份到磁带。 制作一个当前的救援磁盘。 还手动备份AD文件。

如果它没有挂起来备份数据,这是一个开放的系统文件问题。 如果它仍然爆炸,除非你运行交换或SQL服务器,我会怀疑驱动程序或可能的硬件。