我现在正在寻找一种方法来监视服务器硬件,如风扇/电源/等等。问题是,我们有非常dynamic的环境 – 服务器会自动开启/closures – 甚至每天几次,具体取决于负载。
我为我们的超微型服务器(我们只有3-4种types,因此它们非常具体)创build了包含风扇速度检查(0意味着风扇已经死亡)的四模块。 不过,我每次关掉服务器的风扇转速也是0。
所以我现在正在search如何通过ipmi获取电源状态(或者服务器正在运行的任何其他指示器),以便仅在服务器正在运行时发送zabbix警报。
通过ipmi是不幸的要求,因为我们监测这种方式我们没有访问一些服务器。
我想避免写一个脚本来运行类似于:ipmitool电源状态。 Zabbix有一个惊人的ipmi集成,所以我想尽可能使用它。
ipmitool传感器返回:
root@virt1:~# ipmitool sensor System Temp | 28.000 | degrees C | ok | -9.000 | -7.000 | -5.000 | 75.000 | 77.000 | 79.000 CPU Temp | 0x0 | discrete | 0x0000| na | na | na | na | na | na FAN 1 | 8355.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000 FAN 2 | 8355.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000 FAN 3 | 8725.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000 FAN 4 | na | RPM | na | na | na | na | na | na | na CPU Vcore | 1.144 | Volts | ok | 0.640 | 0.664 | 0.688 | 1.344 | 1.408 | 1.472 +3.3VCC | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712 +12 V | 12.031 | Volts | ok | 10.494 | 10.600 | 10.706 | 13.091 | 13.197 | 13.303 DIMM | 1.544 | Volts | ok | 1.152 | 1.216 | 1.280 | 1.760 | 1.776 | 1.792 +5 V | 5.216 | Volts | ok | 4.096 | 4.320 | 4.576 | 5.344 | 5.600 | 5.632 +5VSB | 5.056 | Volts | ok | 4.096 | 4.320 | 4.576 | 5.344 | 5.600 | 5.632 VBAT | 3.232 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712 +3.3VSB | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712 AVCC | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712 Chassis Intru | 0x0 | discrete | 0x0000| na | na | na | na | na | na PS Status | 0x1 | discrete | 0x01ff| na | na | na | na | na | na root@virt1:~#
一个想法可能是查询电源开/关传感器。 这是一个离散的传感器,见https://www.zabbix.com/documentation/2.2/manual/config/items/itemtypes/ipmi有一个例子,如何分析离散传感器的状态。
如果电源开/关传感器无法监测,则可以读取模拟电压传感器,例如“+ 5V”(或更less的电压传感器)。 如果电压接近零,服务器可能会closures(或电源失败)。
在Zabbix 2.2的默认安装中,有两个模板:“Template IPMI Intel SR1530”和“Template IPMI Intel SR1630”。 它们都包含一个“电源”项目,它查询“功率”传感器的价值,这似乎是你所需要的。 如果没有,请描述您使用该传感器时遇到的问题。