运行VMware ESXi的Dell R820的可靠压力testing工具是什么?

我们有一台运行VMware ESXi的Dell PowerEdge R820,在过去的两个月里,它有多个CPU错误。 它最初在CPU1上有一个IERR,现在显示CPU3的CPU检查错误。 我换出了CPU3 – > CPU2和CPU1 – > CPU4,看看错误是否会跟随处理器周围。 交换之后,服务器开启了大约72小时,然后再执行另一个DSET,并且没有更多的硬件错误。 我想对CPU和内存进行24小时的压力testing,以validation它能够在我们投入生产时处理负载。 在运输过程中,CPU可能发生了某种变化(在我们开始接收第一个错误之前不久)。

问题是,我不知道我的特定设置的压力testing工具。 我试着用中断,但它不会启动到正确的。 (挂上“加载sb_edac”)。 有没有一个工具可以推荐我用来testing运行VMware ESXi的R820(Intel Xeon e5-4600)?

在这种情况下,您可以只加载一个Linux live-CD或包含stress工具的救援光盘(我更喜欢PLD Linux光盘 ),并将服务器放在一个循环中。

但是,我会严重依赖戴尔支持,并更换系统板/ CPU和/或RAM。 服务器不健康! debugging这种types的东西可能不是时间有效的。

您是否捕获了ESXi系统的转储? 支持日志?