古代服务器中的坏盘

我有一个1998年的Netware 3.12服务器,它运行在我们校园的一切 :总账,采购,工资,学生信息,成绩,你的名字。 该服务器有一个Adaptec RAID控制器,具有两个卷:

  1. RAID 1,2个17GB scsi磁盘,希捷ST318417W
  2. RAID 5,3个4GB scsi磁盘,2个希捷ST34573W和1个ST34572W。

目前我们正在进行一个项目的早期阶段来取代这个系统,但是你不要只是跳到这样一个新的系统,所以我需要保持这个服务器运行,直到2011年11月。

本周我们没有一个,但两个硬盘驱动器失败。 幸运的是,它们来自不同的卷,我们能够继续运行,但鉴于这些失败的密切性质,我有严重的疑虑,我将能够通过11月的目标,以避免这台服务器的灾难性故障恢复RAID冗余 – 在任何地方只会发生一次驱动器故障,而且我完全被洗了。

我们有幸能够在两个驱动器之间有精确匹配的“备件”,但是备件处于未知状态。 我尝试交换他们,但RAID控制器不够聪明来处理这个,它使系统无法启动。

至于RAID控制器本身,我可以在POST期间通过Ctrl-A快捷键进入实用程序,但是我从这里做不了多less有用的工作。 要实际pipe理卷,我必须首先引导到Netware,此时我可以使用CI/O Array Management Software Version 2.0来查看卷信息。 我怀疑pipe理事物的正常方法是从一个特殊的软盘启动它的控制器软件,但是这个软盘早已不复存在。

通过RAID软件中的选项,我认为replace现有RAID卷中唯一受支持的方式是物理添加磁盘,启动并将其configuration为卷的“备用”,强制卷使用备用来更换现有的磁盘(此时我只是猜测),以便磁盘成为备用磁盘,修复磁盘空间,清除磁盘空间,然后closures并取出磁盘。 然后从另一个失败的磁盘开始。 所有这些都意味着大量的停机时间,假设我可以使其工作,而且我的备件还是不错的。

至于寻找可靠的备件,我不知道从哪里开始寻找一个新的4GB scsi驱动器,甚至是我正在寻找的确切scsi系统,因为它随着时间的推移经历了几次不同的迭代。

另一个select是将其迁移到虚拟机(hyper-v),但是我们之前在这个领域所做的所有尝试都没能实现。 安装这台机器的时候,我刚刚从高中gradle,所以它需要比以前更低级别的软件和dos的知识,或者如果我确实已经被遗忘了(我也不是什么新手)。

我的部分问题是这是一个高使用率的服务器,并把它放下几天来弄清楚事情不会飞得很好。

至于这个问题,我正在寻找任何在这种情况下可能会有所帮助的build议:关于在这个时代寻找好备件的build议,个人经验,使用类似的控制器修复RAID卷,或者从一个类似的控制器构build一个hyper-v虚拟机旧的netware服务器,软盘上的一行,RAID控制器有更好的软件,在内布拉斯加州有一个好的Novell顾问的build议,能够把事情做好,还有一个我还没有考虑过的其他select,等等。

更新:
对于备份,我们只有数据备份(最近通过恢复进行了validation),对于实际运行的软件没有任何影响。

更新2:
只是一个进展报告,我目前有一个工作在VMware虚拟服务器2.0的Netware 3.12安装,主要是我在这里find的指南:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312-on-vmware.html

接下来的步骤是准备空的netware卷,以匹配现有服务器上的额外卷,将C:\驱动器上的所有内容以及我现有服务器上的netware卷进行转储,然后从该信息中找出哪些模块需要添加到netware,安装我的许可证(我们还有这个磁盘,如果有的话),以及移动数据。

我曾经批准在第一年之后把服务器closures一个星期(可惜不是以前),所以除了创build空的卷之外,其余的工作都要等到那个时候。

最终更新(2011年1月5日):
我可以在本周没有数据丢失的情况下在两个RAIDarrays中使用备件。 这两个现在都被控制器列为“FAULT TOLLERANT”(耶!)。 我也能够build立在我上次更新的进度上,现在在VMWare Server 2.0中有一个function“备用”服务器。 备件可以运行和使用我们的erp软件,但是我不能投入生产,因为我还不能从那个盒子打印(我不知道为什么)。 即使如此,如果我没有别的select,这个虚拟机将会勉强维持,而且在它和修复后的RAIDarrays之间,我很自在地适应这种情况,直到十一月份我才能把机器弄脏。

结语(2012年1月16日):
用一个全新的系统replace这个服务器的项目确实按计划进行。 万岁不再netware! 所有的嗨Sql Server! 国王死了。 吾皇万岁!

我们仍然计划让旧的服务器运行一段时间,直到8月份我们的财政年度审计完成后。 但是,如果现在和之后发生失败,没有人会抱怨太多。

获取(并且继续每天或更频繁地)获取共享文件数据的良好备份。 如果你丢了机器,你可能无法find所需的软盘(yep)来恢复它。 如果可能的话,获取Netware引导的DOS分区的副本。

这听起来像一个Adaptec AAA-131 RAID卡(或那个时代的东西)。 如果我是对的,你不会find更好的pipe理软件,因为没有一个存在(见http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html为最后的可用版本)。 我在那天使用了很多这些卡,他们工作得很好。

如果是AAA-131, 在玩configuration时要格外小心 。 没有办法configurationRAID组而不擦拭这些卡上的磁盘。 这意味着,例如,如果您将盒子放下并附加一些testing磁盘,并且清除configuration并在其上创buildRAID,那么当您将“生产”磁盘插回时,将无法使用它们没有卡先格式化他们。 是啊。 这是不好的。

Novell Netware将运行在VMware虚拟机pipe理程序中。 我build议与一个有体面的Novell Netware经验的人签订合同(这里有人 – 我在看你,Sysadmin1138–谁有这个人)帮助你把服务器的内容移到虚拟环境中至less,你可以继续下去。

如果您的客户端计算机是现代的,并且安装了Microsoftnetworking客户端,则可能发现迁移到基于Windows Server的计算机实际上会很快捷。 将Windows Server计算机的名称与Netware服务器的名称相同,公开的目录结构使用与Netware计算机相同的UNC命名约定,复制所有文件,然后在目标计算机上(手动)复制权限。 这可能不是那么困难,您可以事先在testing实验室中“迁移”迁移,并使用它testing一些客户端,以便从脚本/用户环境的angular度来决定需要更改哪些内容。

你可能会从eBay获得一些备用硬件。 然而,你所购买的任何东西都会有可靠性问题。

如果我是你的话,我会在那里帮助你find一个很好的Windows Server来帮助你从这个盒子里迁移出来。 这种情况可能会让pipe理层花费一些钱,几乎在任何时候都可能丢失Netware的全部内容。 replace盒不需要大规模的马力(因为你正在更换),所以软件许可和备份将是你最大的成本。 客户端相关的迁移问题可以通过使用具有良好脚本的咨询师来最小化,并且可以通过login和启动脚本来计划更改客户端相关设置的详细信息。

我知道,因为我已经完成了(嗨埃文),VMWare确实有不错的NetWare支持。 即使是真正的旧东西(你正在运行)。 这个老式的NetWare在空闲的时候NOOPs CPU,而不是HALT,所以无论CPU在虚拟机中给出什么都会被挂住。 这是VMWare工具的用途,他们不这样做。 自90年代以来,VMWare就已经存在了(甚至在BrainShare上已经有了一个摊位好几年了),所以不得不这样做,这就是为什么他们有这个支持。 微软的虚拟化已经足够新,他们从来不需要对NetWare进行虚拟化,所以它在那里不起作用。

如果这台服务器如你所说至关重要,那么为某些VMWare许可证准备应该是一件容易的事情。 至less,spring的VMWare工作站许可证,至less将这个服务器到虚拟环境。 VMWare服务器是免费的(我相信),如果你真的不得不。 一旦完成了这项工作,您可以考虑将其转移到ESXi之类,直到可以更正式地更换为止。

还有其他的select,取决于你的Linux技能。 Novell已经花了相当长的时间让Xen(不是KVM,Xen,尽pipe都使用qemu)来支持NetWare。 它可能会与NW3.12,但你需要确保你使用完整的虚拟化模式 ,而不是paravirtualization。

该服务器是新的,它应该有一个CD-ROM驱动器,这可能是你的保存优雅。 一旦完成了备份,如果您select将其启动到ISO-Linux。 它将无法获取数据,但应该看到硬盘驱动器。 此时,请将两个卷的完整副本复制到networking上的其他位置。 这些驱动器映像可以被qemu直接用作虚拟驱动器。

有办法将dd生成的图像转换成VMware VMDK,但是我自己并没有使用它们。 谷歌他们,他们在那里。

  • 来自BrainShare的P2V较新的NetWare版本 。 这大部分仍然适用于NW3.12
  • 另一个一步一步的,这次使用CloneZilla和其他一些免费工具 。 不需要安装NetWare,但需要手动编辑STARTUP.NCF和AUTOEXEC.NCF文件。 根据你的NetWare-fu,你可能需要帮助。

这对于你的问题并不是很有帮助(坦率地说,你已经有备件了,唯一有用的build议就是“ 将驱动器型号提供给Google购物 ”),但在你触摸其他任何东西之前你应该真的确保你有一个好的备份,并可以成功地恢复到一个新的机器在一个可用的状态

如果这台机器的性能至关重要,那么您的描述应该是您的第一要务。 如果您在一段时间内没有对备份进行成功的恢复testing,那么您应该认为它们毫无价值,而且您需要确保在本机器最后一刻喘不过气时才能真正恢复。
如果另一个磁盘在你身上死了,你没有可用的备份,这几乎是球游戏。 无论您是否准备好,您都将立即转移到新系统。

只是我的$ 3.50。

其他人已经解决了备份等问题,所以我不会再重复这些。 有几件事你可以做,以提高系统继续运作的机会。

首先投资一个质量非常好的线路滤波器,并将其放置在UPS和服务器之间。 那些旧的驱动器现在将对激增,尖峰甚至是相当小的供应波动感到相当敏感。

我从你那里得知,你已经安装了备用驱动器,但是这是我所推荐的:在尝试将服务器中的备用驱动器放在另一台机器上,并用老化软件把它们压在外面,或者使用常规的硬盘testing软件,您无法获得持续的testing周期。 在宣布驱动器值得信赖之前至less保持几天。 已经存储的旧驱动器是臭名昭着的不可靠的,可能会失败的帽子。

上面的build议很好。 试试这个 – 在备用的现代硬件上,尝试从上次完整备份中恢复整个系统。 确保备用机器不在networking上。

那是什么,我怕你会说呢? 您没有备份和/或恢复过程? 那么,现在你知道下周你在做什么了吗?

只需双倍/三重/四重地推荐每天进行备份,直到找出解决scheme。 如果您不能轻松更换死磁盘,您唯一的解决scheme就是迁移到新磁盘。 无论这意味着构build新的服务器,还是缓慢迁移现有的服务器以使用现有服务器中的新驱动器,这是唯一的select。

在一个7年的RAID 5arrays中,我们有3个硬盘中的2个失败。 我们的备份严重过时了。 8天和17000美元后,数据恢复公司能够恢复我们的整个Exchange服务器,但没有人感到高兴。 (除了我之外,因为我每天都应该做备份,所以我要硬件,但是没有人愿意为我买东西,但是其他人却没有这样做)

从这里得到的好处是,客户立即批准了我6个月的更换硬件采购申请。 但是,神圣的废话,这是一个非常紧张的8天。 帮你一个忙,现在做一个备份,然后开始研究一个应急措施,“立即启动你办公室里的任何硬件”备份计划。