在ESX上运行的FreeBSD guest虚拟机没有panic日志

我们有三台服务器在同一个ESX主机上运行,​​所有虚拟磁盘都来自远程SAN存储控制器。 这些树服务器几天前就挂起并重新启动,而今天又发生在DB服务器上。 奇怪的是没有任何恐慌日志,崩溃日志,出现问题时的错误日志。


Server1上。 Web服务器FreeBSD Meduna 8.1-RELEASE-p2 FreeBSD 8.1-RELEASE-p2#2:Mon Feb 14 12:57:36 MYT 2011 hailang @ Meduna:/ usr / obj / usr / src / sys / Meduna amd64

Meduna#cat / var / log / messages | grep恐慌

Meduna#bzcat /var/log/messages.?.bz2 | grep恐慌

Meduna#cat / var / log / messages | grep错误

Meduna#bzcat /var/log/messages.?.bz2 | grep错误

5月28日16:05:04 Meduna内核:/ var:挂起挂起错误:块4文件1


Server2上。 数据库服务器FreeBSD Moncalvo 8.1-RELEASE-p2 FreeBSD 8.1-RELEASE-p2#1:Mon Jan 10 13:02:48 MYT 2011 hailang @ Moncalve:/ usr / obj / usr / src / sys / Moncalve amd64

Moncalvo#cat / var / log / messages | grep恐慌

Moncalvo#cat / var / log / messages | grep恐慌

Moncalvo#bzcat /var/log/messages.?.bz2 | grep恐慌

Moncalvo#cat / var / log / messages | grep错误

Moncalvo#bzcat /var/log/messages.?.bz2 | grep错误

5月28日16:17:17 Moncalvo内核:/ var:mount pending error:blocks -32 files 0


server(服务器)。 FreeBSD Mecure 8.1-RELEASE-p2 FreeBSD 8.1-RELEASE-p2#0:Fri Feb 11 14:45:55 MYT 2011 hailang @ ServerX:/ usr / obj / usr / src / sys / Mecure amd64

Mecure#cat / var / log / messages | grep恐慌

Mecure#bzcat /var/log/messages.?.bz2 | grep恐慌

Mecure#bzcat /var/log/messages.?.bz2 | grep错误

Mecure#cat / var / log / messages | grep错误

5月28日15:42:41 Mecure内核:g_vfs_done():da0s1d [WRITE(offset = 3275046912,length = 16384)] error = 5

5月28日15:42:41安全内核:g_vfs_done():da0s1d [READ(offset = 4062199808,length = 16384)] error = 5

5月28日15:42:41安全内核:g_vfs_done():da0s1d [WRITE(offset = 3281371136,length = 10240)] error = 5


这是/ var / log / messages在发生问题时的样子


May 28 13:06:26 Meduna内核:icmp从10.16.10.250redirect:113.23.142.94 => 10.16.10.18

Mayuna 13:07:01 Meduna内核:icmp从10.16.10.250redirect:202.186.13.232 => 10.16.10.18

5月28 13:15:00 Meduna内核:icmpredirect从10.16.10.250:113.23.142.94 => 10.16.10.18

5月28日13:15:35 Meduna内核:icmpredirect从10.16.10.250:202.186.13.232 => 10.16.10.18

5月28日13:41:36 Meduna syslogd:内核启动文件是/ boot / kernel / kernel

5月28日13:41:36 Meduna内核:版权所有(c)1992-2010 FreeBSD项目。

5月28日13:41:36 Meduna核心:版权所有(c)1979年,1980年,1983年,1986年,1988年,1989年,1991年,1992年,1993年,1994年

它只是吊了半个小时,并没有任何错误重新启动。

5月28日13:13:14 Moncalvo内核:icmp从10.16.10.250redirect:60.49.152.98 => 10.16.10.18

5月28日13:14:25 Moncalvo内核:icmp从10.16.10.250redirect:210.48.150.200 => 10.16.10.18

5月28日13:16:58 Moncalvo内核:icmp从10.16.10.250redirect:183.78.169.57 => 10.16.10.18

5月28日15:59:06 Moncalvo syslogd:内核启动文件是/ boot / kernel / kernel

5月28日15:59:06 Moncalvo内核:Copyright(c)1992-2010 FreeBSD项目。

May 27 15:59:06 Moncalvo核心:版权所有(c)1979年,1980年,1983年,1986年,1988年,1989年,1991年,1992年,1993年,1994年

[!]这个服务器挂起2个多小时重启


我怀疑这可能是一个存储问题,但没有任何certificate。 能否请你给我一些build议来解决/挖掘问题。 任何帮助,高度赞赏!

最好的祝福,

海浪

最可能由SAN故障引起的问题。 当FreeBSD丢失磁盘时,几乎没有办法让恐慌日志进入。 但是在虚拟机环境下(以及很less的主板),重启后可能会有msgbuf( dmesg )。 你可以尝试去检查它。

对于debugging,你可以尝试使用DDB而不是在恐慌后重新启动。

PS。 如果你有系统程序员,你可以要求他为FreeBSD写一些类似Linux的netconsole