我们有三个Ubuntu(可信赖)服务器接受请求。 其中之一是有各种奇怪的问题,我们试图find原因。
首先,我们要排除硬件差异。 因此,我们要validation所有三台服务器上的硬件是否相同,并且每台操作系统都以相同的方式查看所有硬件。 有没有一个简单的方法来获得我们可以比较每个服务器的总结? 几乎就像一个硬件的MD5校验?
尝试安装Ubuntu的List硬件包。
sudo apt-get install lshw
运行命令
sudo lshw -short
在所有三个硬件上,并在安装Compare插件后使用Notepad ++进行比较。 这是我能想到的最好也是最简单的方法。 上面的命令当然会留下很多细节。 如果您需要详细信息,可以省略-short开关,并将输出路由到html,xml或txt文件,如下所示。
sudo lshw > hardware.txt sudo lshw -html > hardware.html sudo lshw -xml > hardware.xml
你也可以尝试使用Excel工作表。 取决于你感到舒服。
dmidecode
命令可能已经安装。 尝试这个:
dmidecode -t 1 | egrep'(Manufacturer | Product | Serial)'; dmidecode -t 0 | egrep'(Version | Release)'; dmidecode -t处理器| egrep'(Socket | Version)'
我有兴趣看到输出…
但是,如果您遇到稳定性问题,硬件差异可能不是问题。 这是一个托pipe环境吗? 如果是这样,他们可能使用低端或手工组装( 咳嗽…超微型 )设备。 您可能想要查看问题服务器上的内核环缓冲区( dmesg | tail
)是否有任何消息。
这些提供商使用的设备types通常没有任何forms的硬件监控。 您可能有像IPMI这样的带外选项,但它不像通用硬件上的传感器/组件那样紧密集成。