我正在运行OEL 6.4(一个RHEL克隆),每晚通过ssh读取大文件。 在rsync期间,我经常(大部分时间)会发生内核恐慌:
Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:Oops: 0000 [#1] SMP Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:Stack: Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:Call Trace: Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:Code: 00 55 48 89 e5 48 83 ec 10 48 89 1c 24 4c 89 64 24 08 66 66 66 66 90 41 89 d4 48 89 f3 e8 cf 23 fe ff 41 83 fc 01 48 89 c2 75 1a Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:CR2: 0000000000000000 Message from syslogd@cheshire at Mar 24 00:39:01 ... kernel:Kernel panic - not syncing: Fatal exception
在上面有没有任何信息可以给我一个理由的线索,还是全是通用的? 崩溃时, /var/log/messages中似乎没有任何exception。
编辑:
我应该提到我正在使用ocfs2(本地不聚集)。 正在传输的文件是虚拟机的备份文件,在传输的时候它们并没有被使用:它们是纯粹为了rsync的目的而采用的“reflink”拷贝。 操作系统是最新的补丁。
内核恐慌可能由几个因素引起,例如
为了帮助确定问题的根源,我尝试了一些rsync --dry-run (它不会复制任何东西)。
另外,我前一段时间看到FS安装noatime选项可能会有问题, relatime更好。
另外,我会尝试带有--delay-updates选项的rsync ,最小化实际的文件更新时间跨度。
这是现在想到的,如果别的东西敲响了,我会更新答案。