我正在寻找一个基础设施资源监控工具,经过一天没有成功的谷歌search,我希望有人能帮我find它。 我在6个月前阅读了这篇文章(我想我是通过黑客新闻发现的),现在我找不到链接了。
从本质上讲,这个监控工具简单地把所有的事情都做好基础,学习基础设施使用的模式,然后提醒你在这些模式中发生变化。 随着时间的推移,曾经是一个variables的variables被认为是一个模式,随着系统的不断学习。
Riverbed公司的Cascade产品有类似的东西,但他们只关注networkingstream量。 有人有这个服务器资源监控,但我没有find他们。
其他人还记得最近读这个新产品吗?
经过多年使用Nagios实施监控系统,我质疑这种工具的有效性,除了一小部分的服务。
我们所使用的大多数系统在典型的一天/一周内都有大幅改变的使用特征。 有些系统星期一其他星期三相当忙碌,有些在白天很忙,有些则在一夜之间等。
我可以把这样一个系统想象成为25%的系统,或者在很多时候可以获得某些参数(如磁盘或内存),其他的参数,比如CPU或者networkingutil,在我看来都是真实的挑战。
存在一种Holt-Winters时间序列预测algorithm , 即使时间序列数据存在周期性波动(例如,每日峰值),它也可用于分析时间序列数据并检测exception情况。 rrdtool实现为“HWPREDICT”RRA,它在监视时收集附加数据以实现该algorithm并确定阈值。
可以使用Holt-Winters分析根据实际数据趋势(与先验configuration相对)dynamic确定阈值。 $ work具有完全自定义的系统,我们可以将HWPREDICT数据添加到特定的RRA,然后在超出阈值时生成警报。 它运作良好,但正如我所说,是完全自定义的。 我很想知道是否有现成的产品可以为我们做到这一点。