Articles of 监视

服务器响应时间长

我们有一个高stream量的网站,在高峰期有1000并发用户,最less有100用户在同一时间。 平均每天有40,000到100,000访问。 这个问题有时会加载得非常慢(我们把这次命名为灾难时间 :)),那时候我们试图用Firefox加载网站,显示waiting… (我尝试了与世界各地的许多提供商一起) 我们在灾难时间监视服务器, CPU load , Memory Usage情况正常。 另外, MySQL查询日志缓慢,不会有任何查询长达1 sec 。 Apache没有任何错误。 iotop不显示任何导致此灾难的事情。 灾难时间和高峰时间没有任何关系是非常有趣的。 有时灾难发生在300并发用户,而另一个时间则不同。 我找不到他们之间的任何关系。 如何在灾难时间跟踪数据包? 我想知道这个灾难是我们的数据中心的故障(如上游或防火墙)或我们的服务器故障(如Apacheconfiguration,Web应用程序或其他任何我不知道的)。 对于其他数据只是添加评论,然后我编辑我的问题,以提供您需要回答的数据。

系统监控冗余

我在一个小型商业环境中进行了咨询,我有两台HyperV主机(<10台虚拟机)+另外两台服务器。 我最近遇到了一个HyperV主机出现CPU问题的问题,它带来了大部分非重要的虚拟机,另外还有一个用于networking和系统监视和可用性的免费软件。 正因为如此,iDRAC也locking了这一事实,所以我没有收到关于这次事故的警报。 所以我想知道如何才能(便宜地)获得冗余可用性监控系统 – 就像在两个不同的HyperV主机上运行Nagios或Zenoss一样简单? 看起来好像运行Nagios / Zenoss /等不止一个副本可能很昂贵,而且开销很大。 思考?

testing用户是否在networking上loginPC

如何检查特定用户是否在我的活动目录networking上的特定计算机上login? 我是这个networking的pipe理员,宁愿用PowerShell来做,但我愿意接受其他的select。

以编程方式查询Nagios状态

我最近购买了一个不错的7×11 LED显示屏,我想(除其他外)显示我的nagios状态。 为此,我需要查询我的Nagios安装的状态。 从一个远程的Nagios服务器(比如说一个perl脚本)获取一个状态摘要(例如,非正常服务的数量)是什么合适的方式?

使用主机服务覆盖Nagios主机组服务

我目前正在尝试为主机组中的所有主机定义一组服务,这工作正常。 我的问题是,我希望能够从主机组中覆盖主机中包含的这些服务定义。 例如,对于某些情况,某个特定的Linux服务器需要从默认值提高PING检查阈值。 因此,例如,我想在linux-server主机组中拥有一个主机,它inheritance了几个服务(SSH,Disk,PING等),但是对于我想用自己的唯一值覆盖的特定服务,定义一个特定于该主机的服务,具有自定义值。 例如。 使用定制的PING服务定义在linux-server定义一个主机: define host { use n1-host host_name server-01 hostgroups linux-server alias Test Linux Server parents my-gateway,upstream-gateway address server01.test.com } define service { use generic-service host_name server-01 service_description PING check_command check_ping!100.0,5%!400.0,15% } 不幸的是,即使主机名称和服务描述与组级别的PING检查相匹配,只有一个针对server-01 PING服务被列出,这是组级PING检查,而不是主机级别。 它似乎是注册在一些水平上,因为我可以看到我的Nagios日志: Jul 16 19:12:27 localhost nagios:警告:在主机“server-01”上为服务“PING”find重复的定义 但最终,我不能像检查服务检查结果的“性能数据”那样工作,我可以看到数据中包含的阈值是组检查的阈值,而不是主机检查。 不过,我的理解是,在3.2.0版本之前做了一个改变,允许主机级别的服务优先于主机组级别的服务。 我目前正在运行3.4.1 ,所以我认为这应该是工作。 一些导致我相信这个特性的链接应该已经被实现: https://www.mail-archive.com/[email protected]/msg29273.html http://forum.centreon.com/showthread.php/10643-Over-riding-checks-in-hostgroup http://ehc.ac/p/nagios/mailman/message/22496927/ http://markmail.org/message/ms6rzljthml7ejlt 此外,我已经从3.4.1源代码中检查了我的xdata/xodtemplate.c文件副本,并且在“跳过列表”中看起来好像在主机级别检查中的优先级高于主机组检查。 虽然承认,我的分析是原始的。 […]

是否有可能logging每个访问磁盘/目录?

我需要一些脚本来logging(只是输出到控制台或文件)每个访问某个磁盘或目录(或者适用于我)。 我也想知道究竟(哪个子目录或文件)被访问。 我的系统是Ubuntu的Linux。 这是可能的吗?我该怎么做?

PCI-DSS 11.5选项 – 部署文件完整性监控软件

对于我在数据中心pipe理的某些服务器,我正在寻找符合PCI-DSS第11.5节的选项。 有几台服务器(less于20台),大部分是CentOS5,但是有一些RHEL4和Solaris9 Sparc。 我相信Tripwire,Inc.是这个领域的领导者,但是我正在寻找额外的select,包括商业和FOSS。 请包括您使用您推荐的软件的经验理由。

如何使用nagios监视linux服务器的内存使用情况

刚刚在中央机器上安装了nagios,在10台远程linux机器上安装了nrpe,并开始监视它们。 它工作很好。 我可以得到CPU负载,当前用户,进程,MySQL等。我无法find一种方法来监视使用核心插件的内存使用情况。 我错过了什么? 我需要一个外部插件来做到这一点?

如何获得顶部和PS的Apache的显示url请求?

有没有办法让Apache显示正在处理顶部和PS的url? 这将帮助我们更快地确定性能问题。 谢谢。

Nagios主机closures,但服务了

我有几台服务器(ftp),主机阻塞ICMP,因此显示为closures,但是服务(如ftp)已经启动。 停止服务抱怨主机被closures我已经承认这个问题。 我遇到的问题是在另一个晚上的FTP服务死亡,但我们没有得到有关它的通知。 我怎么能仍然得到有关Nagios认为是closures的主机上的服务状态通知,如果我禁用主动检查将解决这个问题? 干杯卢克