我们看到一个虚拟机的情况下挂着以下症状:
- 平均负载800,进程停滞,CPU 100%在iowait
- 读文件工作,写文件挂起系统
- RAM利用率很高,但在系统正常工作时预计会如此
- / var / log / messages不会显示任何可疑内容:没有内核崩溃,没有OOM kill,但是我们有一些内核堆栈跟踪,比如任务被阻塞超过120s,并且存储相关的堆栈跟踪。
- 虚拟机监控程序显示虚拟机在CPU利用率方面几乎空闲。 重新启动系统是使其重新工作的唯一方法。
- dmesg提示内核任务的堆栈跟踪在io_write / sync syscalls中挂起超过120秒
pipe理程序是Oracle Enterprise Linux 7.2,VM是CentOS 6.6。 它正在运行一个jboss设备。 块设备是virtiotypes的。 qcow驱动器在虚拟机pipe理程序上本地托pipe在SSD中。 我们怀疑在文件系统 – >块设备 – > virtio层有问题。