软件logging服务水平

我在Ubuntu机器上提供云服务(SaaS),并将很快面临服务级别协议(SLA)。 也就是说,我们必须看看我们可以提供什么样的服务水平(可能在每天或每周的基础上),然后有一个可靠的可用性logging来certificate在特定时间范围内的服务水平。

目前,直接在提供服务的服务器上logging可用性就足够了。 然而,我没有find一个解决scheme来logging服务的可用性,并每天,每月和每年“返回”可用性指数。

这个任务(如我迄今为止所想象的)非常简单:每20秒钟请求一个HTTP / S资源,检查内容中的关键字,创build一个日志文件条目,并(可选地)从中计算可用性百分比并将其存储到一个表中。 理想情况下,也可以定义核心时间(例如上午9点至下午5点),并计算此时的单独百分比。

从技术上说,如果这样的软件运行在服务服务器或监控服务器上(当然,这会影响停机logging的准确性),这应该不会有什么不同。

  • 我已经使用monit进行服务器监视,但日志文件似乎不适合从它计算可用性百分比。
  • 我也考虑过一个简单的脚本,只是写日志文件,但我认为至less有一些软件包可以做得更好。

感谢您的任何想法。 如果我完全错了,请让我知道。 SLA对我来说是一个新的领域,但我并没有超越networking的介绍。

有这个云解决scheme…

当然,老式的监控解决scheme也可以计算出这些百分比。 OpenNMS做得很好。

示例消息:

所有服务都在节点General-ppro上。 新的停电logging已经创build,服务水平可用性计算将受到影响,直到解决停电。