工程师正在使用爆炸物去除我们办公楼外的硬岩。 我们应该采取什么对策?

我们的build筑位于约。 距爆炸物100米。 他们每天发生好几次,真的很震动整个build筑物。 这将持续很多天,爆炸事件应该会变得更强。

我们的服务器房间没什么特别的; 其中一个架子全部用硬质混凝土制成,而另一个则有一个活动地板(让电缆穿过地板)。

有没有人有任何提示,对策或最佳做法?

目前我们正在考虑采取以下对策:

  • 每日报告服务器机房状态指示灯(HD灯,电源等)。
  • 每晚检查最重要的服务器上的磁盘扫描
  • 额外供应备用硬盘

编辑:这里有很多好的答案! 但是需要被接受。 在这个编辑的时候,最高票数的答案会被接受。

    如果我是你,我会打电话给公司的保险公司,让他们放置一个加速度计。

    这样 – 保险公司就会知道你不是那个摇动磁盘的人,保险公司一定会知道什么时候每次爆炸都已经停止,以防你的SAN在同一时刻死亡。

    (我们做到了。)

    现在应该确定您已经validation了您的备份解决scheme。 如果您的备份已损坏或无法使用,那么世界上所有的replace硬件都不会救您。

    除了所有其他优秀的build议(尤其是非 现场备份 )之外,您还应该考虑防尘措施 ,以实际可行的方式进行防尘 :在门周围进行防尘处理 ,在窗户周围粘贴胶带等。
    如果您有外部进气口,计划在爆破结束时更换filter。

    所有这一切,我不会浪费时间/资源在夜间磁盘扫描,或在备用硬盘上的钱(也许买一个或两个最关键的机器,但记住,如果需要,你可以通宵驱动)。
    服务器设备令人惊讶的强大,并将在一些相当糟糕的情况下继续运行多年。 有机会,你会没事的。

    将您的服务器机架安装在ISO-Base平台上。 这样可以将服务器机架与地面震动隔离开来,即使在移动的情况下也可以使系统正常工作。

    这并不容易,但是有效。 特别是在地震区。

    要查看ISO-Base的实际运行情况,请查看在地震模拟期间显示服务器机架中的效果的video。 一个机架安装在ISO-Base上,第二个机架不安装。

    电源:如果您断电,机架中的所有服务器,存储设备,SAN(等)都将自行重新启动? 或者只有在按下“开”button后才会出现?

    这有两个原因:

    • 如果电源不稳定几个小时,您可能需要将服务器closures,直到事情稳定为止 – 服务器被错误的电源峰值带走的可能性减小。
    • 你最后一次是什么时候需要重新安装机架上的所有设备? 你有安倍的处理吗?

    您也可能build议您的用户closures,并在每天晚上拔掉电脑。

    大多数人谈论备份 – 没有多less谈到恢复。 确保从备份还原尽可能简单。 特别是如果时间很关键。

    如果您有一个共址复制,请将其切换为主设备(如果时间允许),因为您的build筑中的设备更容易受到攻击。 他们也更可能在工作时间(显然)下降。

    我也build议在家工作。

    玩重金属以取代爆炸时的坚硬岩石。 无论如何,坚硬的岩石如此过时。 ;)

    更严重的是,也许在angular落里有一个DJ的齿轮店,你可以拿起一些冲击吸收/隔离的东西。 许多(舞蹈音乐)DJ在播放唱片时(例如,在微小的旋转凹槽中保持一个微小的针头,有点像磁盘驱动器那样的敏感设备),在极端音量的情况下也同样困难,而周围的人群跳跃和冲压在地板上同步(“同步”是重要的;如果你从来没有听说过塔科马海峡大桥事件,你应该考虑看这个剪辑 )。 打开几个垃圾袋以提供额外的防尘保护。

    我很惊讶没有人提到过程的一面。

    这是完成您计划的业务连续性的绝佳机会。 如果您需要将办公室搬到一天或一周,计划是什么? 你有最新的图纸计划和哪个系统有优先恢复? pipe理层介绍,你有一个计划,并意识到

    从服务器机房造成的破坏加速可能是您担心的最小的问题。 除非您拥有现场供电和强大的连接能力(假设您不是独立的,只支持当地员工),否则您的公用事业可能面临更高的风险。

    如果有水电或电力或互联网接入失败,你能活下来吗? 你打电话给你的互联网提供商,看看他们是否知道爆破,并已准备好通过替代路线恢复服务,如果你的公用事业被打断。 你会比我们所能猜到的更好地了解你的具体情况,但是你应该有一个你需要的function列表,并且处理“如果这意外消失会怎么样? 为每个。

    只要在你的头上/纸上写下这些内容,就可以帮助你了解是否有任何需要工作的弱点,或者如果你的组织没有任何logging,可能会把这个弱点传达给你。 从两页开始,执行摘要 – 仅供参考,以便每个人都知道你在做什么。

    是的 – 手头上有一些额外的硬盘/备件是好的,但是我会更担心我看不到或者没有直接控制的东西。

    这个过程练习的真正好处是检查当前的监测系统。 一旦你计划了一些基本的场景,你会为意外做好准备。 简要总结一下你所期望的存活和不存在的东西,不pipe你为什么遭受停机,都会非常方便,同时也帮助你全力改善监测,而不是基础开始震动。

    我曾经在一个正在回收的矿址上运行电脑。 随着填海工作越来越靠近办公室,数据室几乎每天都在摇摆。

    我的反措施包括把机架放在一些为减振devise的硬橡胶脚上。 他们是由曼森制作的,我只是估计了我的机架的重量,并购买了合适的脚。 这似乎可以修复机架内的任何移动。 艰难的部分是轻轻地举起机架足以滑下脚。

    另外,正如其他人所说,我有备份,我testing,并保持在现场。

    这些服务器持续3年,不断抖动硬件相关的崩溃。 办公室里的台式机不够好,其中2台硬盘出现了灾难性的故障。

    我还没有看到有关备份的这一点,但确保你把它们赶出现场! 您可能还想要对交换机,防火墙等configuration进行备份。

    重读BOFH编年史。 它会给你一些关于如何使爆炸停止的实际想法。 其他一切只是一个对策。

    就对策而言,其他人都提到了备份,所以我会避免重复这个好的build议。

    每天检查你的raid 5arrays,现在有空闲的磁盘。 所有这些振动对于主轴来说都是不利的,而且由于没有人听到的报警和第二主轴故障,多less次可保存的arrays会丢失,这是惊人的。

    也许我很乐观,但是做爆破工程的工程师通常不把振动水平作为“摧毁邻居的基础”的能量水平,所以我最担心的是计算机的移动部分,也就是磁盘。

    请工程公司做爆破。 赔率非常好,他们现场有自己的装备,或者过去曾经对邻居服务器机房造成过爆炸伤害。

    在机架下面放一些保护装置,特别是硬质混凝土的保护装置。 它会(或者可能)震动很多。 如果不能买(特别是因为时间的缘故)买一些抗震地板,在它下面放一些泡沫,以减less震动。