我们最近从Rxxx系列的R410和R710系列中购买了几台dell服务器
我们在这些服务器上使用的操作系统是:CentOS 5.4
我们得到了非常奇怪的错误信息,并且我们几次失去了networking连接(重新启动networking接口需要修复)
我们得到的消息是:
来自syslogd @的讯息Wed Nov 18 12:07:08 2009 …
服务器名称内核:Uhhuh。 NMI收到原因不明20。
来自syslogd @的讯息Wed Nov 18 12:07:08 2009 …
servername内核:你有一个奇怪的省电模式启用?
来自syslogd @的讯息Wed Nov 18 12:07:08 2009 …
服务器名称内核:茫然和困惑,但试图继续
我们从来没有在以前的一系列戴尔供电服务器上看到这些消息
在Rxxx系列上使用centOS 5.4做某人? 他也发生了吗?
也许你有一个关于如何防止它发生的build议
更新:
谢谢(你的)信息
好吧,我已经联系戴尔课程,他们甚至更换我们的服务器中的主板
事实上,我看到在一个以上的服务器(一个R410和其他R710)奇怪的操作系统消息让我觉得,也许有操作系统和服务器之间的冲突问题
在一台以上的服务器上,甚至在主板更换之后,都没有任何意义
戴尔说他们不支持centOS,我做了他们的DSET诊断并发送给他们,他们没有看到任何东西。
所有软件都是最新的。
看看http://kbase.redhat.com/faq/docs/DOC-16294可能的解决scheme。
运行Xen Kernel和bnx2驱动程序的RHEL5.3挂起的解决scheme是通过添加行来编辑/etc/modprobe.conf
选项bnx2“disable_msi = 1”
解决scheme是:echo options bnx2 disable_msi = 1 >> /etc/modprobe.conf /etc/init.d/network restart
我不知道,如果戴尔解决了在最后的固件更新。 但即时将这些参数添加到运行CentOS的任何RXXX服务器
这绝对是一个硬件相关的问题。 除了检查服务器的bios和bmc固件是否是最新的,我会联系戴尔支持并打开一个案例。
他们可能会说CentOS不是受支持的操作系统,但是如果它是作为OEM购买的,它们确实支持RHEL5,如果你能说服他们内核消息是硬件相关的,那么情况就会升级到软件支持。
为了加快速度,请向他们提供他们用于RHEL的诊断工具,运行它们并发送收集到的报告。
您是否为该机器/操作系统组合安装了所有相关的戴尔自定义工具? 我认为这是一个IPMI问题,在这个问题上,如果没有安装正确的驱动程序/工具,机器会告诉操作系统它不知道如何处理。
也可以尝试启用或禁用HPET在您的BIOS设置和/或grub.conf。
谢谢(你的)信息
好吧,我已经联系戴尔课程,他们甚至更换我们的服务器中的主板
事实上,我看到在一个以上的服务器(一个R410和其他R710)奇怪的操作系统消息让我觉得,也许有操作系统和服务器之间的冲突问题
在一台以上的服务器上,甚至在主板更换之后,都没有任何意义
戴尔说他们不支持centOS,我做了他们的DSET诊断并发送给他们,他们没有看到任何东西。
所有软件都是最新的。
也许有关于此的其他信息? 更多的想法,我应该尝试解决这个问题?
谢谢
我刚刚经历了一些尝试弄清楚这一点。 更换一台运行Centos 5.4的R410后,发生了完全相同的问题。 其特点是:
只要停止并启动NIC(ifdown / ifup),如果挂起,将会重置它,但需要重新启动计算机才能恢复正常运行而不会阻止连接或丢弃数据包。
任何人都可以确认标志'选项bnx2“disable_msi = 1”'解决这个问题? 如果没有保证,我不愿意把这两台机器中的任何一台重新投入使用。