我在最近安装了一个古老的盒子(HP ProLiant ML350 G4)上安装了一个CentOS 6.4服务器,它已经不到24小时。 它具有RAID 1 + 0中的6个146 GB 10k SCSI驱动器,也是全新的,没有驱动器故障或任何types的硬件通知。 然而,随机的这将发生:
一旦发生这种情况,我无法login(这发生在login提示),SSH没有响应。 平反应,但否则盒子被锁紧。 请注意,重启可以在短时间内解决问题,但在CentOS 6.4 和 Debian 6上至less有3次不同的时间,都是干净的安装。
任何人有任何见解?
编辑:事后显示没有logging(甚至没有提到的消息)。
HP齿轮上的固件始终是重要的。 那个时代(2003年至2005年)的Smart Array 6400和641/642控制器曾经在某些情况下冻结和做各种各样的时髦事物。 将固件更新到最新版本。
在Linux方面, CCISS块设备驱动程序在内核中已经有很长一段时间了。 它通常是稳定的。 但是在EL6上还有一些其他的考虑。 调整您的I / O调度程序或使用tuned-adm实用程序。 如果您正在执行任何写入重要的活动,请确保您在该控制器上具有电池供电的caching。 并使用hpacucli ctrl all show config detail命令在控制器上运行健康状态检查。 只要确保没有任何磁盘在时髦或prefailure状态。