我正在为我的公司开发程序,如果主服务器脱机或类似的事情会发生什么。 我们现在有一台服务器正在运行,但是如果要离线,我不确定我们预期的停机时间会是什么,或者到底是怎么回事。 我正在确定RAIDconfiguration/设置在这里: 在Linux中显示硬盘驱动器设置
我所知道的服务器是HP Proliant DL580
具有8x Intel(R) Xeon(TM) MP CPU 3.00GHz (32 bit)
和16 GB of RAM
。
有了那么多的处理器,是不是1个电源就够了? 目前有2个电源连接到机器,如果需要2个,那么我没有任何备用电源,如果1失败,但如果它可能只需要1,那么我应该是好,如果1失败。
我正在使用JungleDisk来备份服务器configuration。 理想情况下,我希望能够获得第二台服务器,并将其插入数据中心,然后继续。 我们现在拥有的第二台服务器并不像我们现场运行的服务器那么强大,但它能够完成工作。
你们会build议我在这里做什么?
你正在做的是一个非常基本的灾难恢复计划。 有关于这个问题的完整书籍并没有完全回答这个问题。
基本上,这归结于:您的业务的宕机成本是多less? 基于宕机的可能性,你应该花多less钱来避免它? 你预计什么样的失败情况,你如何防范呢?
处理灾难恢复的最佳方法与处理任何IT运营问题的方式相同:从头至尾了解您的系统。 如果有什么地方你不明白它是如何工作的,学习它。 你可能需要build立一个虚拟机器或者一个新的系统,把旧系统的碎片拼凑起来,直到它工作。
话虽如此,有各种技术可以帮助您避免长期停机。 SAN启动,裸机恢复,虚拟化,热备份和冷备件等都有所贡献。 其中一些可以和应该一起使用,其他人不应该。 在你能弄清楚什么能为你提供最好的回报之前,你需要弄清楚什么是刘海。 你需要一个预算和一个策略。
PSU冗余:首先你需要一台function强大的服务器,你想知道一个PSU是否足够使用8个内核。 它应该是足够的,在你的服务器的后面,你会看到两个插头,这两个是另一个的冗余。 理想情况下,您应该将每个插头插入不同的电源sockets以获得真正的冗余。
RAIDconfiguration:我认为你应该使用RAID 1.两个驱动器同时出现故障是非常罕见的。 只要确保监视你的服务器的坏部分。 不要只依靠一个驱动器,特别是在生产上。
备份:所以你可能想更好地了解备份和冗余。 在我们的例子中,备份是可以移动的,不依赖于主服务器来启动。 如果我们想要回滚到特定的date,那么我们就依靠这个东西。 既然你已经这样做了,那对你真的很好。
冗余是你想要实现,以确保您的服务器上的高时间。 从集群到热备份有很多方法。 这将取决于您的需求以及应用程序的部署方式。
让我知道如果你有什么我错过了,你正在寻找一个答案。
谢谢
首先,你需要弄清楚你的宕机时间有多大,他们的期望是什么。 窗口和他们的期望将决定使用哪些技术来减less停机时间。
其次,看你需要多长时间从第二个盒子上恢复服务器。 这是你的基准。
第三,弄清楚如何才能见到窗户,缩短恢复时间。 另外,要弄清楚他们想花多less钱。 这是谈判正常运行时间与成本的地方。 您可以通过购买SAN来使用vSphere,也可以每隔几个小时运行一些脚本,然后将这些数据发送给热备件。
第四,运行DR演习,以确保一切正常。
服务器PSU应该是冗余和热插拔的。 我会打电话给惠普,确保在打电话后在维护窗口中进行testing。