Articles of Nagios

如何让Nagios用户查看某些服务器的状态,但不禁用/启用任何东西?

如何让Nagios用户查看某些服务器的状态,但不禁用/启用任何东西?

Nagios vs Icinga:我应该用哪一个?

我正在寻找在我的networking服务器(CentOS,LAMP设置)上安装服务器监控应用程序。 经过一番阅读,似乎Nagios是最受欢迎的解决scheme,但一年前它被分割到了Icinga。 我应该用哪个? Nagios仍然在积极开发? Nagios插件是否与Icinga兼容? configuration仍然是Icinga的恶梦? (这似乎是对Nagios的主要投诉)。 如果你已经使用了两者,每个的优缺点是什么?

如何在icing-web中添加主机?

如何在icinga-web中添加主机? 我是否需要修改access.xml并重buildcaching? 或者我可以有一个类似于icinga / nagios的configuration?

使用Nagios检查SSL证书的有效性,包括CA链

Nagios可以进行SSL检查,但实际上并不检查证书是否对您使用的连接地址(通用名称匹配)有效。 在我们的其中一台服务器上,Postfixconfiguration文件被Plesk更新所取代,而没有通知,导致对蛇油证书的退化。 Nagios检查SSL,但没有看到它。 为此,我想检查不仅仅是到期date,而是实际检查CA链。 我已经尝试了几个SSL插件的nagios,但他们都不能做到这一点。 有人有build议吗?

NRPE和$ USER1 $variables

我有所有我的远程Linux机器上运行的NRPE守护进程。 我有几个configuration,我试图在我的nrpe.cfg标准化path。 更改通过Puppet部署。 我想使用下面的语法: command[mycommand]=$USER1$/check_tcp .. etc. $ USER1 $variables在我的NRPE设置中不可用。 我可以为所有变体编写Puppet模板,但是我更愿意通过本地方法来pipe理这个模板。 有什么可以做的吗? 如果没有任何人有一个示例Puppetconfiguration,将解决这个问题?

远程检查只读文件系统

我需要远程定期检查Linux文件系统是否安装在只读服务器上。 在这种情况下,我唯一可以使用的工具是通常的CLI脚本语言(BASH / Perl / Python),SSH和SNMP。 我到目前为止的想法是: 共享SSH密钥并远程执行mount命令,grep / awk-ing给定挂载点上的RO标志。 通过SNMP检查,但我不确定这些信息是否可用或是多么容易。 尝试通过SCP文件或远程触摸文件。 SNMP方法是我能想到的最好的/最干净的,但是我不知道如何做到这一点,因为CLI SNMP看起来像一场噩梦,特别是如果我需要运行一个决策过程来find基于给定安装点。 理想情况下,我只想使用BASH(包括sed / awk / grep等)和SNMP,但需要一些指导从哪里开始! snmpd已经在所有服务器上安装并configuration了v2。 这个脚本的最终用途将是一个Nagios命令。 非常感谢您的帮助! 注意我们已经有cacti / nagios设置了监控服务器的数量,当我最初发布的时候我忘了提及这个!

Nagios电子邮件通知中的完整状态信息?

我build立了Nagios来监视我的服务器,并且写了一些检查。 当我收到通知邮件时,我只能得到状态信息的第一行,而且我必须使用Web界面来查看其余部分。 是否有可能在电子邮件中获得完整的状态信息? 我将如何configuration?

将Nagiosconfiguration为警报,具体取决于服务警报源自的主机组

所以我的设置: 服务在所有主机(CPU / RAM /磁盘/服务)之间共享。 主机分为两大类:“生产”和“发展”。 我们有两个联络小组:“生产”和“发展”。 比方说,我的开发SQL服务器在RAM上运行低,我希望它只提醒那些在“开发”联系人组(这项服务当然分配给“开发”主机组中的一个主机,使用共享RAM监视服务)。 我几乎被困在这个…我不能在服务级别configuration它(他们在那里共享),我似乎无法得到升级来为我做… 我是否需要使用服务组以及升级并咬紧牙关build立该列表? 还是我错过了一些愚蠢简单的东西? 如果有帮助,我正在使用Centreon进行configuration。

如何根据SNMP中的原始CPU滴答来计算CPU百分比

根据http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#scalar_notcurrent ssCpuUser , ssCpuSystem , ssCpuIdle等不赞成使用原始变体( ssCpuRawUser等)。 前者的值(不包括nice,wait,kernel,interrupt等等)返回一个百分比值: 在最后一分钟计算的用于处理用户级代码的CPU时间百分比。 此对象已被弃用,以支持' ssCpuRawUser(50) ',可用于计算相同的指标,但超过任何所需的时间段。 原始值返回CPU花费的“原始”滴答数量: 处理用户级代码花费的时间(通常为1 / 100s)。 在多处理器系统中,' ssCpuRaw* '计数器在所有CPU上累计,所以它们的总和通常是N * 100(对于N个处理器)。 我的问题是:你如何把蜱的数量变成百分比? 也就是说,你怎么知道每秒钟有多less个嘀嗒声( 通常是 – 这意味着不总是 – 1 / 100s,这意味着每100秒钟1次,或者嘀嗒声代表1/100秒钟)。 我想你也需要知道有多less个CPU, 或者你需要获取所有CPU值来将它们加在一起。 我似乎无法find一个MIB给你一个CPU的整数值,这使得以前的路线尴尬。 后者的路线似乎不可靠,因为有些数字有时会重叠。 例如, ssCpuRawWait有以下警告: 此对象不会在底层操作系统不测量此特定CPU度量标准的主机上实施。 这个时间也可以包含在' ssCpuRawSystem(52) '计数器中。 一些帮助,将不胜感激。 到处似乎只是说%已被弃用,因为它可以派生,但我没有find任何地方,显示官方标准的方式来执行此推导。 第二部分是这些“蜱”似乎是累积的,而不是一段时间。 如何在一段时间内采样值? 我想要的最终信息是:“用户,系统,闲置,漂亮(理想情况下,窃取,尽pipe目前似乎没有标准的MIB)”的百分比(在过去的1-60s可能就足够了,偏好较小的时间跨度)。

Nagios – 新用户没有启用权限

我遵循networking指南中的简单步骤: a)通过命令htpasswd htpasswd.users username将用户添加到Nagios b)在cgi.cfg文件中添加这个用户到行: authorized_for_system_information=nagiosadmin, username authorized_for_configuration_information=nagiosadmin, username authorized_for_system_commands=nagiosadmin, username authorized_for_all_services=nagiosadmin, username authorized_for_all_hosts=nagiosadmin, username authorized_for_all_service_commands=nagiosadmin, username authorized_for_all_host_commands=nagiosadmin, username c)重新启动nagios3服务,甚至重新启动apache2服务 但是当我尝试从nagios的web界面列出任何东西,它仍然给我这个令人讨厌的消息: It appears as though you do not have permission to view information for any of the services you requested… If you believe this is an error, check the HTTP server authentication requirements for accessing […]