如何防止终止长时间运行的Python脚本

我有一个在基于虚拟机的远程Ubuntu服务器上运行Python脚本cron作业。 该脚本需要几个小时才能运行,而且我注意到内核似乎在脚本完成之前终止脚本,如日志所示:

myscript.py: line 11: 4890 Terminated 

在运行时,我已经通过顶端监视了我的脚本的CPU和内存使用情况,并且它永远不会过多。

如何找出脚本被终止的原因以及如何防止提前终止?

您可能会超出默认或/etc/security/limits.conf设置的某些限制。 你可能想要运行命令ulimit -a作为一个cronjob。 这应该显示您在cron下获得的限制。

有可能这个工作被一个空闲的terminal监控程序或失控的stream程杀手错误地杀死了。 有很多这样的程序,其中大部分可以被编程为忽略已知的长时间运行的进程。

编辑:默认值有可能超出的限制。 这些是我默认获得的限制:

 :~$ ulimit -a | grep -v unlim core file size (blocks, -c) 0 scheduling priority (-e) 0 pending signals (-i) 61167 max locked memory (kbytes, -l) 64 open files (-n) 1024 pipe size (512 bytes, -p) 8 POSIX message queues (bytes, -q) 819200 real-time priority (-r) 0 stack size (kbytes, -s) 8192 max user processes (-u) 61167 

这些open filesstack size是我期望最有可能被超过的两个。 可以通过计算/ proc / XXX / fd中的条目来监视打开的文件,其中XXX是脚本的进程ID。 我不知道任何简单的方法来监视堆栈大小。 从增加堆栈大小限制的脚本运行程序可能有助于确定这是否是问题。

我还会检查在程序结束时写入的所有日志,看是否有任何logging。 如果你可以修改程序在退出的时候更加冗长。

如果是内核,你应该在dmesg中看到它的提及。 否则,你必须寻找其他的东西来终止你的脚本(也许是一个太宽泛的killall python其他地方?)。