监视长时间运行的进程

我需要在Linux上启动一个长时间运行的内存/磁盘/ CPU密集型进程,并对其进行监视,以便:

  • 检查它终止一个良好的状态代码,
  • 收集统计信息(每x分钟logging一次cpu磁盘)
  • 警报/重新启动,如果进程是振荡

那里有什么东西吗? 我知道软件来监视服务/守护进程,但不是一个漫长的过程,在临时的基础上。

这是Monit的一个很好的候选人, Monit是这个问题上的标签之一。

使用Monit,您将能够查看进程状态,内存使用情况,CPU使用情况,运行时间和其他详细信息。 Monit将允许您通过名称模式或PID跟踪进程。 您还可以控制启动,停止或重新启动进程。

在这里输入图像说明