对于COUNTER和DERIVEtypes的Munin插件,我应该使用${name}.warning和${name}.critical值来使用${name}.critical值?
这取决于你正在测量的数据(而不是数据types)。
计数器是绝对值,所以您只需指定应该出现的最小值和最大值。 一个常见的例子是当前login到系统的用户数量。 (通常)没有任何人login,所以没有最低限度。 在服务器上,通常不会有太多的同时活动的login,所以你可以警告是否有五个活动的login,如果有十个或更多的login发出重要的警报。 这看起来像这样:
users.warning :5 users.critical :10
DERIVE字段是变化率值,所以您只需考虑您想要查看的最小和最大费率。 假设您正在监控以瓦特为单位的电功率(这是一个DERIVE领域,因为系统报告自从poweron消耗的焦耳总数,您从中得出瓦特数)。 如果系统通常吸收80瓦,那么可以将阈值设置为75和100瓦以发出警告,而将阈值设置为70和130瓦以获得关键状态。 (如果功耗太低,其中一个系统组件可能是坏的,因为大多数计算机的正常工作电stream的下限,另一方面,“太高”的瓦特数将取决于更多的外部因素,如你的电力基础设施的容量。)这看起来像这样:
power.warning: 75:100 power.critical: 70:130
我希望我已经用我的例子说明了限制设置很大程度上取决于你正在测量什么,并且没有一般的方法来表示“DERIVE数据源应该具有X:Y的警告阈值”。