是否存在一个用于监视/检查(并重新启动,即为段错误)运行守护进程的Linux服务?

我正在寻找一种Linux服务,每n秒观察一次正在运行的进程/守护进程列表,以检测(并注意到重启进程)任何问题(如nginx中的分段错误)。

有没有?

你可以试试看。 它可以做的不仅仅是监控stream程,尽pipe我猜这不应该是一个问题。

有几个。 他们被称为watchdogs

DJB的守护神工具可以做到这一点(但是它很糟糕,我甚至不会给你一个链接)。

也有人写过的看门狗脚本的各种示例( 这个很不错 ) – 通常是一个shell脚本,它读取一个PID文件,检查相应的PID是否存在,并通知您或重新启动受影响的服务if不是。
他们通常每分钟/ 5分钟/时等用完cron作业 – 比现实世界中几乎没有必要更严格的粒度。

如果你有一个适当的监控系统,你可以经常挂钩你的监控系统,让警报进入一个处理程序脚本,试图重新启动服务已closures(但要小心误报的负面影响 – 这里重新启动你的networking服务器,当你不需要造成更多的伤害比好)。