从ITangular度来看,我们是一家小商店,通常通过eBay购买几乎所有的灰色市场供应的服务器和networking硬件。 在将灰色市场硬件投入生产之前,我有兴趣开发更严格的testingstream程。 什么硬件压力testing,testing套件等被推荐用于这种情况?
注意:对于这个问题,我不感兴趣辩论购买新硬件或灰色市场硬件的优点。 考虑到我们的规模和预算,我们认为,从灰色市场购买 – 无论是旧硬件还是新硬件 – 都为我们提供了最好的回报。 谢谢。
我们在$ JOB的新东西旁边购买了合理数量的二手IBM设备。 现在所有的HS / LS刀片,但过去我们都有很多x3 **比萨饼盒。 正如我确信你知道的那样,其他人在租赁协议和硬件刷新结束时会有一些很棒的东西。 通常甚至在制造商保修期还有一段时间。
通常情况下,我们所看到的任何问题在BladeCenter或BIOS的事件日志中都相当快速地显现出来。 通常可以通过短时间运行机器并重新启动来挑出它们。
看到S / H齿轮装有驱动器并不常见。 每当我们这样做,他们就会被抛弃。 纺纱介质几乎总是硬件链中最薄弱的环节。 您不知道驱动器之前是否出现过问题,或者在运输过程中是否掉线。 驱动器很便宜,购买新的,这是不值得我们的麻烦。
至于什么工具使用的技术问题。 由于您似乎只是在处理IBM机器,所以您可以使用IBM已经投入的方便且全面的诊断工具。 只需在启动时按F2即可。
我认为这取决于你的正常运行时间要求,以及你正在处理的“灰色市场”的水平。
如果您的正常运行时间要求很高,那么您希望依赖于基础设施冗余,这样一台机器的损失并不意味着您的客户的服务损失。 购买双倍,build立冗余 ,并监视您的主机和networking,以便您知道什么时候需要更换的东西。
如果你的正常运行时间要求不是很高,但你只需要工作的硬件,然后评估你买的人。 不要购买非DOA保证的东西。 如果可以的话,从翻新店购买至less90天的保修期,尽pipe如果你负担得起,一年将是非常好的,并且确保你可以从其他渠道获得零配件,如果原件closures。
memtestp和iozone是我的两个最爱。
另一个想法是尝试和标准化你的系统。 尝试购买相同的硬件,然后可以作为备件,如果需要的话。 实际testing将取决于可用时间。 我会尝试创build自己的自动化(和可重复的)testing套件,这将强调所有主要组件。 CPU,内存,磁盘I / O,networkingI / O是我会试图强调一个testing,应该运行几次,并用于设置基准。 在基线之下执行的每个系统(低于10%或20%)应在部署到生产之前重新进行检查。
我通常使用外部介质(例如USB闪存或networkingPXE引导)将待测系统引导至虚拟磁盘。 这使我能够以破坏性的方式testing驱动器,并开发一个良好的多用途testing环境。
对于驱动器testing,我使用badblocks破坏性的4通道testing在原始设备上,例如
badblocks -vw /dev/sda
注意:这将擦除驱动器上的所有数据! 如果您有多个驱动器,则可能会进一步强调系统并行testing它们。
编译Linux内核被认为是一个很好的整体系统testing。 我为每个CPU核心运行一个编译循环。 configuration一个默认的内核源代码树,并复制每个实例。 然后在每个例子中做一些事情:
while (1); do make clean && make bzImage; done
当内核编译正在进行时,您可能需要使用传感器观察CPU温度,例如:
while (true) do sensors | grep Temp; sleep 5; done
运行这个24小时,你应该有一个很好的可靠的系统在结束。
我喜欢用memtest86来testing内存子系统。 它会让你知道你的系统中是否有坏的内存模块。
对于CPUtesting,我喜欢运行Distributed.net RC5-72客户端; 这将加载您的CPU到100%处理72位RSA密钥。 如果CPU或相关组件出现问题,我想这会find它们。 我让它尽可能运行 – 除了强调我的CPU以外,它也提高了我的DNETC统计:)也许,对于压力testing系统,我至less要运行它24小时。
如上所述,badblocks是压力testing磁盘驱动器的一个好方法,如果您希望保留它们(单独讨论)。 VMBed提到的破坏性读/写testing的替代scheme是非破坏性读/写testing,这将使数据保持不变。