如何使用Prometheus和Grafana监控REST API延迟

我想监视我的Tomcat服务器上的请求处理延迟。 稍后将基于此执行一些警报将是很好的。 我使用%D模式configuration了Tomcat阀门,因此它将logging访问日志文件中处理每个请求的时间。 从这些对数线计算50,90,99个百分点的正确方法是什么? 我已经为基本主机指标(cpu / mem,hdd)configuration了Prometheus和Grafana,但是我不清楚如何正确计算百分位数,并用prometheus / grafana来绘制它们。 想法是检测应用程序hicckups,并在它完全没有响应之前作出反应。 谢谢大家!

您可以使用我的tomcat_exporter通过configuration响应时间度量的筛选器来执行此操作。 或者你可以自己实现一个类似的filter。