在投入生产之前,在validation新服务器的硬件方面是否有任何最佳做法?
例如,通过制造商的硬件testing运行它,或者运行memtest几小时?
-Josh
你正在寻找的短语是“燃烧”。 我通常使用UCBD并运行memtest一段时间,并为任何硬盘驱动器制造商执行扩展驱动器testing。 我没有足够的新处理器问题来说服我去testing它们。
有关更多信息,请查看此社区wiki。
在安装操作系统之前testing服务器
我喜欢通过快速memtesttesting,但实际上并没有产生大量的负载,所以更多的是validation没有比系统老化更糟的错误。
然后,我安装并运行kcbench -a -r -n -n 50 。 这个循环运行了一个内核编译(使用所有的CPU),这接近了我们真正的负载,并且kcbench在Fedora和EPEL中可用,所以它很容易达到。 作为奖励,我得到一个简单的基准数字,让我了解新硬件的性能。
之后,检查dmesg是否有错误。
就我个人而言,我从来没有在生产箱上做过任何这样的事情。 如果我从惠普或太阳获得一个价值几千美元的盒子,或者我希望他们把我寄给一个工作单位。 我所有的早期失败都是在运作的第一天左右。 为什么在安装操作系统或configuration机器时,只要发现问题就浪费时间进行烧录?
再次,我们所有的机器都是由Puppet自动configuration的,所以如果在生产之前有什么东西死掉了,我们只需架起另一台机器,再次按下“go”button。