开源工作/stream程pipe理/监控/控制系统

我正在为以下内容寻找开源解决scheme:

我有需要不断运行的工作。 作业是应用程序或脚本。 如果失败,则需要重新启动。 如果失败,连续说10次或在一定时间内说1小时,就需要取消并通知中央库。 如果作业开始升温(使用CPU或内存等),则应该发出警告,如果过热,则会发生警告。 这些工作可以select性地安排在一定的时间内运行。

我知道必须有开放源代码,独立于平台,高级语言(即在python等中实现)的全方位服务,成熟的解决scheme,但我甚至不知道要寻找什么或者这样的系统叫做。 我做了很多谷歌search,但还没有find这样做的所有这一切。

主pipe (使用Python编写)将会完成你想要的大部分function。 它可以使用XML-RPC API扩展其他function。