我正在尝试使用Icinga来监视特定string的网站。 当我从命令行运行插件时,它似乎工作正常,但在Icinga-Web中,无论我input什么string,总是显示成功。 #Doesn't Work – always returns ok define service { host_name mywebserver service_description Check Website servicegroups Websites check_command check_http!-s "no such string" -H www.mysite.com -u /apath/ -t 7 use generic-service notification_interval 60 ; set > 0 if you want to be renotified } 奇怪的是,如果我运行插件位于/ usr / lib / nagios /插件/ check_http如下,它给了我我所期望的: ./check_http -H www.mysite.com […]
我有一个内部实验室,我需要监视,但我想确保我正在监控正确的东西(这是我在运营pipe理方面的第一次破解)。 现在我有以下服务器来监视: Web服务器(IIS) 数据库服务器(SQL – OLTP) 数据仓库服务器(SQL – OLAP) 另外3台服务器在负载testing期间实际上产生负载。 目前,我只是监视磁盘空间的使用情况,如果有任何逻辑磁盘的可用空间低于10%,我将收到警报。 这些机器都不是生产的,他们都在testing实验室,所以不需要24/7的正常运行时间,我们也没有人接电话修理机器。 主要我们只是想知道一个磁盘是否即将失败,如果我们白天的空间不足(由于数据库在testing过程中膨胀或者其他原因)以及我没有真正考虑的事情需要监控networkingstream量,例如?) 为了这个问题的目的,假设我只是运行Perfmon并手动挑选计数器。
所以,我有两个来自不同ISP的接口,我试图用mtr监视我的连接。 这是我目前正在尝试使用的命令: mtr –no-dns –address $MY_REAL_IP_HERE $A_DESTINATION_IP 不幸的是,这不是我想要的界面。 目前我有eth1和ppp0 ,我只想监视ppp0 。 任何想法我做错了什么?
我有zabbix 2.2.1和252监视主机。 目前,数据库在本地,大小为65GB的数据库正在运行pipe家清理历史logging超过30天的pipe家。 条目被删除,磁盘空间不会增加。 请给我一些build议,我可以修复它。 问候
我使用主板的RAID1来镜像2个SSD,在Linux服务器上它只能看到1个“Intel Volume1”,在1个SSD失败的时候,我怎么知道? 谢谢。
我的老板已经命令我find一个可以连接到我们的8台服务器的盒子,这样我们就可以查看VGA输出并使用键盘,就好像我们坐在服务器的正前方一样(即看到它正在启动),通过networking。 解释解决scheme的graphics化尝试是: 我搜查了很多,但是我的search受限于这样一个事实,即我不知道这样一个盒子可能被称为什么,或者甚至存在。 任何人都可以帮我拿这个盒子的名字,甚至更好,帮我find一个? 我知道这是一个潜在的巨大安全风险,因为攻击者可能进入机器,从而几乎物理上访问服务器,但是我的担心对决定没有任何影响。
我有一个ETL过程,我试图通过几个不同的“企业”networking作为虚拟机进行部署。 我知道这是相对轻量级的,但是一个客户对VM需要分配来完成工作的绝对最小资源非常感兴趣。 除了调整虚拟机参数,直到它无法运行,有没有办法测量我的CPU和内存要求是什么? 我可以只从主机上分析虚拟机进程,并使用这些粗略的估计? VMWare和VirtualBox是最初的目标。
我刚刚安装了Munin来监视我的Web和数据库服务器。 我大量的插件是开箱即用的,但是我可以使用一些build议来确定哪个是关键指标。 Disk IOs per device Disk latency per device Disk usage in percent Inode usage in percent Throughput per device Utilization per device Fork rate Number of threads Processes Processes priority VMstat CPU usage File table usage Inode table usage Load average Memory usage Swap in/out 所以我的问题是, 哪些参数是关键指标,有什么值得监测? 注:我也使用Apache和MySQL的插件,但在这里我对磁盘/系统/进程插件感兴趣。 我已经询问了关于在数据库pipe理员的数据库上监视什么的build议: https : //dba.stackexchange.com/questions/77162/what-to-monitor-key-indicators-for-mysql-server
我正在使用Nagios通过check_load插件监视我的服务器上的CPU使用情况。 在周末我们有一些批量工作正在运行,而且几乎没有真正的用户,所以我想要有一个更高的警告阈值。 我已经看到了在这些时间内完全禁用通知的解决scheme,但是如果负载变得非常高,我仍然会收到通知。 我也看到defince 2服务的解决scheme,一个用于工作日,另一个用于周末,但是我希望整个星期都将CPU负载保持在一个图表中。 任何想法或例子,我可以有一个单一的服务有不同的门槛?
今天,我有两台独立的HP ProLiant服务器上的磁盘进入预测性故障。 其中一台服务器运行Windows Server 2008 R2,一台运行Oracle Enterprise Linux 5(一台基于RHEL5的发行版)。 如果查看这些服务器的集成pipe理日志,Windows服务器会有一个“Caution”条目来声明预测性故障,但是OEL服务器不一样。 我们有一些围绕IML(票证整合,报告等)的现有业务stream程,因此有这些消息的优先select。 所有正确的钟声和口哨响起的Windows盒,但没有从OEL服务器。 我已经回顾了我的监控系统的警报历史logging,并且显示这一直是这种情况–Windows服务器报告它的磁盘故障(预测和实际),而OEL服务器不报告。 SNMP陷阱警报似乎正在工作; 这些都logging在root的邮件文件中,并被捕获在/var/log/messages文件中。 有趣的是,OEL服务器上的IML 似乎显示出修复了先前磁盘故障的条目。 这只是日志中缺less的最初的“注意”或“失败”条目。 Windows服务器具有作为操作系统的Intelligent Provisioning / Smart Start安装的一部分安装的所有HP Management Agent。 OEL服务器启用了RHEL5 HP yum repo,并安装了hpsmh , hpilo , hp-health和hp-snmp-agents软件包。 Windows服务器是DL380p Gen8,而OEL服务器是DL380 G7。 我没有其他运行OEL的服务器代用来进行比较(尽pipe它似乎是我运行OEL的三台DL380 G7服务器所共有的)。 进一步检查显示其他Windows服务器上的IMLlogging驱动器错误,至less早在G5(所以我不认为这是一代问题)。 我也看过/opt/hp/hp-snmp-agents/storage/etc/cma*中的启动/configuration脚本,但是看不到与IML有关的任何东西(不是我真的知道我在找什么这里)。 它是一个缺less的包或configuration语句(即容易解决的东西),是防止这些消息到达IML? 或者这是一个已知的问题(让我别无select,只能在业务stream程中进行其他操作)?