NOC情境意识

在我们的NOC中,我们保持对所有物理安全区域(反应式video馈送)的态势感知,关于数据中心物理特征的一些基本信息,天气和全国新闻馈送。 还有其他的事情,你推荐NOC显示器,或者这是足够好的。

    这是一个相当广泛的问题,但我假设我们正在避免服务或逻辑级别的监控(即SSH侦听,网站正确响应,磁盘空间,CPU使用率等)。

    您的NOC应该进行持续的双向监控以及定期动手/睁眼监控。

    不断监测:

    • 数据中心中多个传感器的环境温度/湿度
    • 数据中心所有电路的功耗
    • 空调机组的自我报告负载/健康状况
    • 数据中心内部的video源,所有数据中心入口以及NOC区域的入口
    • UPS电池状态
    • logging数据中心的所有入口/出口(无论是刷卡还是手动login)
    • 切换端口/路由器接口状态事件(上/下/改变速度)

    定期演练:

    • 机架closures并locking
    • 任何声音或视觉硬件警报(灯光,音调,状态LCD)
    • 地砖铺设完好,状况良好
    • 数据中心入口closures并locking
    • 照相机不受干扰
    • 数据中心内或附近没有意外的访问者
    • 失败的灯光,破碎的窗户,损坏的门,任何使人身安全更容易破坏的事物

    另外,为什么要为国家新闻提供资料呢? 除非你的数据中心分布在全国各地,否则调入当地新闻台更有意义。 然而,这个整体的价值是值得怀疑的,因为它将是一个非常高的噪声:信号比率。 如果有的话,只要订阅你的相关新闻网站的RSS提要。

    最后,这可能不是你正在寻找的东西,但是我发现在我的networking之外进行testing是非常宝贵的。 testing高延迟或数据包丢失的几个众所周知的networking(谷歌,雅虎,微软等)与小包和大包​​,检查共同网站的正确返回代码,并测量往返几个stream行的免费邮件网站(Yahoo,Hotmail,Gmail)在我的用户开始打电话之前给了我几个微妙的问题。

    Securitywizardry.com上提供的雷达总是我想要放在NOC / SOC的大等离子体上,用于冷却因子: http : //www.securitywizardry.com/radar.htm

    它包括安全新闻,“健康”级别,新出现的威胁以及有关工具更新的信息。

    我的思想是走在物质的一面。

    虽然经常走,如果你是现场和24/7办公室,然后有2人走在他们的轮class开始分别。 如果他们走到一起,他们只会聊天,不会看到他们应该看到什么。

    • 如果不在现场,尽可能设法定期走路,不pipe是雇员还是雇用当地的承包商来做。
    • 我会说每周分钟,但每天更好。
    • 如果在那里有任何液体pipe道(HVAC冷冻机组,生活用水pipe道,上方浴室的污水等)
    • 寻找不合适的地方
    • 在电子传感器之前,滴水pipe可以被肉眼捕获
    • 检查地板下
    • 感受暖通空调通风口,确保它们处于开启状态
    • 听到UPS的。 如果他们嗡嗡声更正常,那么你可以检查一下
    • 你也有同样的变压器
    • SMELL,有很多电子设备在那里开始油炸
    • 保持卫生

    如果你有一个独立的发电机/杂物间,也请检查一下

    • 确保燃油pipe路没有泄漏
    • 保持卫生
    • 噪音和气味
    • 如果发电机正在进行自动testing,请在testing后检查一下,确保没有发生任何泄漏。

    每年进行一次电子面板热扫描不是一个坏主意。 这会发现接近失败的装备,因为它会显得更热。

    每一次失败都会从小处开始,如果小时候抓到失败的话,你可以按照你的时间安排

    怎么样:

    • NOC员工RSS提要/推文

    NOC中的每个人如何分享信息? Yammer( https://www.yammer.com/ )可能是共享企业级信息/状态(通过电子邮件/ IM / RSS)的好方法

    内部或外部事件的RSS源可能是有用的。 我们使用内部博客进行更改控制,并使用RSS阅读器屏幕保护程序将输出传输到Mac。