我可以采取哪些措施来调查每两周冻结一次的KVM客人? 通过“冻结”,我的意思是当我尝试连接“ssh”或“virsh console”时没有响应。 主机是Ubuntu(natty,11.04),使用libvirt来pipe理客人,客人是Ubuntu(natty,11.04),这两个服务器版本都没有安装窗口pipe理器。
如果我强迫客人重置,它可以正常工作一个星期。 guest系统日志中没有最新的或相关的消息(表示内核恐慌等)。 就我所知,可能是虚拟networking和tty正在打破,阻止我和客人交谈。 主持人还有另外三位几乎一模一样的客人,他们一年都保持稳定。 如果guest虚拟机崩溃了,syslog中是不是应该有一些提示?
该磁盘是使用virtioconfiguration的lvm逻辑卷
% cat /etc/libvirt/qemu/vm-et.xml <domain type='kvm'> <name>vm-et</name> <uuid>8df572f1-e1dc-275a-4b9f-b7c322e2f5d3</uuid> <memory>2048576</memory> <currentMemory>2048576</currentMemory> <vcpu>1</vcpu> <os> <type arch='x86_64' machine='pc-0.12'>hvm</type> <boot dev='hd'/> </os> <features> <acpi/> </features> <clock offset='utc'/> <on_poweroff>destroy</on_poweroff> <on_reboot>restart</on_reboot> <on_crash>destroy</on_crash> <devices> <emulator>/usr/bin/kvm</emulator> <!--<disk type='file' device='disk'> <driver name='qemu' type='qcow2'/> <source file='/usr/scratch/appliances/vm-et/ubuntu-kvm/tmpzwV0x3.qcow2'/> <target dev='hda' bus='ide'/> <address type='drive' controller='0' bus='0' unit='0'/> </disk>--> <controller type='ide' index='0'> <address type='pci' domain='0x0000' bus='0x00' slot='0x01' function='0x1'/> </controller> <interface type='bridge'> <mac address='52:54:00:5a:1f:b4'/> <source bridge='br0'/> <model type='virtio'/> <address type='pci' domain='0x0000' bus='0x00' slot='0x03' function='0x0'/> </interface> <input type='mouse' bus='ps2'/> <graphics type='vnc' port='-1' autoport='yes' listen='127.0.0.1'/> <video> <model type='cirrus' vram='9216' heads='1'/> <address type='pci' domain='0x0000' bus='0x00' slot='0x02' function='0x0'/> </video> <memballoon model='virtio'> <address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x0'/> </memballoon> <disk type='file' device='disk'> <source file='/dev/vg1/lv-et'/> <target dev='vda' bus='virtio'/> </disk> <serial type="pty"> <source path="/dev/pts/3"/> <target port="1"/> </serial> </devices> </domain>
调查那里的各种问题是非常困难的,因为你需要隔离设置的不同特征并对其进行testing – 在这样一个复合设置中非常困难,而且复制是一个为期两周的过程。
首先要做的就是configuration系统日志,通过networking将日志发送到远程系统日志服务(可能是在主机上运行的服务器 – 您需要在系统日志服务器上启用远程光照访问),以允许您可以捕获由于存储空间不足或同步问题而未能logging到来宾日志中的错误。
如果这不能提供有用的信息,你可以尝试连接客串口控制台( 在这里input链接描述,参见这里了解细节),并将发生的任何事情logging到主机上的日志文件中。