你们中许多人可能已经完成或正在考虑绿色IT项目,目标是在计算机资源需求低时closures空闲或不需要的系统:
您在系统监控中如何处理这种情况? 我对Nagios的解决scheme特别感兴趣。
一个想法是在Nagios中为关机主机安排停机时间。 但是,这种解决scheme的缺点是主机仍然会列在Nagios Web界面的“问题”视图中。 如果没有这种“污染”,是否有更好的解决scheme(即“问题”观点只显示需要系统pipe理员维护的实际问题 )。
一个干净的解决scheme将是一个新的“绿色ITclosures”东道国。 但AFAIK这不存在,是吗? 你有其他build议或解决scheme吗? 监控dynamicIT环境的最佳方式是什么?
简单的方法:
状态视图中有内置filter,位于页面顶部。 您可以让pipe理员观看“未确认”的问题,或在没有计划停机的主机上观看问题。 或者任何其他数量的组合。
如果您确实想过滤CGI视图,请参阅源代码中cgiutils.h的“主机和服务筛选器属性”部分,以获取可用的filter的完整列表。
困难的方式:
请参阅适应性监控文档。 有了这个,您可以随时更改nagiosconfiguration,因为系统会自动closures/开启电源。 例如,您可以调整检查周期,将检查命令更改为check_dummy变体,启用/禁用事件处理程序等。
我认为您需要一些自定义开发来创build一个新的状态视图,从问题服务器列表中删除计划停机时间的主机。 我怀疑nagios开发社区中的某个人可以做这个收费。