我想监视两个Linux系统(Ubuntu和Red Hat)的内存。 我意识到我可以从启动运行memtest86来诊断坏RAM。 但是在系统还在运行的时候,是否有任何解决scheme来监测内存? 我有点想到一个守护进程,从随机的未使用的内存写回来。 有人见过这样的事情吗?
大多数具有合理质量的现代服务器都有一个IPMI模块,它会报告错误的RAM(通常是通过来自ECC RAM的SBE(单一位错误)消息) – 您正在服务器中使用ECC RAM吗? IPMI模块还监视和报告一堆其他有用的东西。
您可以使用各种networking监视系统(如果您拥有IPMI NIC的pipe理networking)或使用大多数Unix系统上提供的ipmitool来监视IPMI模块。 许多供应商(戴尔和IBM肯定)也有专门的工具来询问IPMI模块进行在线诊断。 请咨询您的硬件供应商以了解更多详情。
这是一个脚本:
http://www.grons.nl/memtest.sh
从这里: http : //web.archive.org/web/20080726104439/http : //people.redhat.com/dledford/memtest.html
它看起来好像多次拆开linux内核的副本来耗尽可用的内存(我认为这可以被修改,所以它testingRAM的“好的部分”,但不是全部),然后检查解压后的副本以validation完整性。
智能使用一个简单的工具。