服务器完全冻结在未知的条件

我最近组装了一台虚拟化服务器。 这个问题在安装中未被发现。 当我部署应用程序(基于Ubuntu 12.04下的openstack)时,服务器随机冻结(通常是10到40小时)。 它可以承受极端的压力testing,这意味着没有温度问题。 有趣的是,当内核已经用完了几乎所有的缓冲区的内存(我尝试通过使用dd),系统几乎被冻结,不能接收任何传入的networking连接,但连接仍然存在。 根据手册,应用程序应始终能够从缓冲区分配内存,如果没有其他可用内存。

另外,我试图从系统日志中挖掘一些东西,但内核却有很多

UPDATE

经过一番等待,我得到了一些有用的信息 内核升级后服务器没有崩溃,但留下了一些东西。

Jan 24 19:38:25 shisoft-vmhost kernel: [ 5083.584670] sbridge: HANDLING MCE MEMORY ERROR Jan 24 19:38:25 shisoft-vmhost kernel: [ 5083.751554] EDAC MC0: 2 CE memory read error on CPU_SrcID#0_Channel#1_DIMM#0 (channel:1 slot:0 page:0xc8b77d offset:0x40 grain:32 syndrome:0x0 - OVERFLOW area:DRAM err_code:0001:0091 socket:0 channel_mask:1 rank:1) 

看起来像内存问题,有什么想法?

服务器中的RAM很差:channel:1 slot:0,这可能是第二个通道中的第一个stick。