我们目前正在使用我们的环境,并禁用惠普服务器可以自动重启的所有方式。 这是为了应对大规模的中断,导致我们的服务器开始扑动,导致数百万客户的服务中断。 来自“高”的请求是closures服务器,但不能重新启动,直到“海岸清澈”(我们有几个地理位置冗余的站点)时,人员可以手动引导它们返回到在线状态。
到目前为止,我已经确定了以下可能的原因:
但是,我认为当服务器传感器中的一个传感器超过了临界阈值时(例如环境温度传感器超过40摄氏度),还有另外一种configuration。这应该绝对closures主机,但是我不确定configuration是在环境温度下降后禁用自动重启。 或者这也是由HP ASR控制的?
我只是想确保没有任何我已经忘记的情景可以咬我们的生产。
任何帮助,将不胜感激。
最干净的方法是控制你的环境。
这些服务器平台的环境温度阈值是有据可查的 。
专注于保持您的设施和环境在这些阈值之内。 ( 重复自己? )
如果您描述的客户数量,这个任务落在您的设施和/或数据中心团队,对吗?
在本地服务器级别,唯一的其他参数是BIOS 热关机选项。
如果遇到这种types的问题,至less在您有时间通过国际劳工组织自动closures受影响的系统时,这种情况很less会突然发生。