监控服务器 Gind.cn

Linux：空闲CPU的极端负载

我正在调查一个运行着许多oracle数据库实例的linux服务器上的极端负载（但CPU，IOWAIT，SYS，磁盘/networking活动较低）的奇怪情况。当在机器上加载一些cpu时，一切看起来都很正常，正如我们在vmstat中看到的那样： procs ———–memory———- —swap– —–io—- –system– —–cpu—– 2 0 193312 1959440 403368 38270032 0 0 2504 25 4660 3916 16 5 78 1 0 1 0 193312 1899352 403560 38277932 0 0 2198 1720 5175 4675 14 5 79 2 0 1 3 193312 1878992 403584 38279024 0 0 13900 14261 2054 […]

查找哪个进程导致在特定硬盘上的利用率

我们的服务器有多个硬盘并运行多个进程。我们有一个磁盘的磁盘利用率很高，我想找出导致这个问题的哪个进程。我使用iotop命令，但它不会被磁盘过滤，并且它有一个很大的输出。我用nmon ，只是说我们在磁盘上有很多读取io。如何通过硬盘过滤进程并按io使用进行sorting？操作系统：Ubuntu 14.04

快速找出起搏器/ corosync是否有法定人数

在一个shell脚本中，我们目前调用/usr/sbin/pcs status cluster ，然后用grep -qE查找'Current DC:.*partition with quorum' grep -qE 'Current DC:.*partition with quorum'来确定集群是否正常。我想知道是否有一个更快的方法，因为pcs status cluster查询所有节点的PCSD状态，这需要时间，大约一秒半，我想做这个检查之前做某些操作是要经常做。 pcs status nodes both并计算在线节点的数量是同样好决定如果群集没有问题？这大约需要2秒钟： pcs status cluster 2>&1 | grep -qE 'Current DC:.*partition with quorum' pcs status cluster 2>&1 | grep -qE 'Current DC:.*partition with quorum' 这需要约0.2秒： pcs status nodes both | grep -cE 'Online: [az]+ [az]+ […]

在Nagios中为NC_Net转义字符

我正在尝试使用Nagios（3.0.1）监视MSMQ队列计数器。远程服务器正在运行NC_Net。 check_commandconfiguration如下所示： check_command check_nt!COUNTER!-l "\\MSMQ Queue(servername\\private$\\queuename)\\Messages in Queue","%.f messages in MSMQ queue" -w 5 -c 10 这不起作用。我相信美元符号需要逃脱，而且在解决问题方面遇到困难。这篇文章build议“$$”即。 check_command check_nt!COUNTER!-l "\\MSMQ Queue(servername\\private"$$"\\queuename)\\Messages in Queue","%.f messages in MSMQ queue" -w 5 -c 10 但是这不起作用。我已经尝试了一些其他的方法（反斜杠，单引号等）。有什么build议么？编辑：我一直在通过命令行进行一些testing，这是我认为这是造成问题的原因之一。以下工作： ./check_nt -H hostip -v COUNTER -l "\\MSMQ Queue(Computer Queues)\\Messages in Queue","%.f messages in MSMQ queue" […]

Windows 2008中构build带宽监视工具？

我们承载了许多Win 2008服务器，现在我意识到商业带宽监视工具，但是我知道有一些像NetMon等Windows服务器可用的networking工具，我不知道如何使用它们，我相信Windows 2008 Web Edition应该有一些内置的工具..否则，我们必须真正去买一个..

通过Nagios和SNMP监控路由器的带宽使用情况

我正在使用GroundWork （一种基于Nagios的监视框架）通过SNMP监视一些networking设备，但是我仍然遇到了带宽使用问题。大多数路由器，包括这里使用的Cisco 2800，都可以通过SNMP查询networkingstream量信息; 然而，他们以计数器的forms返回这个信息，意思是“自打开路由器以来有多less字节进入或离开给定的接口”。所以，为了从这些信息中获得一些有意义的东西，你需要每秒钟查询这些信息，看看每个度量与前一个度量有什么不同。 Groundwork / Nagios可以自动pipe理这些性能数据，因为它们使用RRD来存储这些数据，RRD支持计算值之间的增量。但是如何在带宽使用超过一定限度时产生警报？只有当一个值高于给定阈值时，Nagios才能发送警报，而不是基于同一个值的两个不同度量之间的差异。我需要一种方法来检查带宽使用是否超过了一定的阈值，如果发生这种情况，会生成Nagios警报（从而发送电子邮件）。我不能仅仅依靠pipe理员查看性能数据来查看networking带宽是否有问题。

你如何避免/检测DNS劫持？（又名最新的Twitter黑客）

Twitter今天的新闻都被DNSredirect/劫持黑客攻击。我的问题是，你们用什么工具或技术来监视你的DNS / whois并检测到这种攻击？

JMX实时监控应用程序

我正在寻找一个（可能）桌面应用程序来实时监控通过JMX的应用程序。应用程序必须提供使用图表和仪表devise具有来自多个JMX查询的值的仪表板的function。如果值超出阈值，我必须能够设置某些值的阈值，并用声音提醒。应用程序将始终运行在我们手术室的大显示器上。 Nagios，Hyperic等传统的监控应用程序在我的“实时”需求中并不适合。他们也非常擅长维护监控或警报的历史，但缺乏一个好的和快速的GUI。我的预算是200美元，但免费和开源始终是首选。我有一些时间来定制它。

如何使用Nagios监控思科IPsec VPN？

如何使用Nagios监控思科IPsec VPN？我想检查用户是否可以连接到VPN。

Wifi活动监视器

我正在寻找一个工具来总结每个节点的WiFistream量。我并不是在寻找像嗅探包这样的奇特的东西……所发送的实际数据是无关紧要的。我想要一种方法来看到SSID Alpha是活跃的，有100kbs的活动，SSID Beta是活着的没有活动，等等。如果列出了每个SSID的802.11types（a，b，g，n？）和频道号，则可以获得奖励。如果每个networking的活动在过去一小时/一天/星期内有一个图表，或者至less有一些累加的粗略字节被传输，则为奖励。我试图解决的问题是，在我们的大楼里有太多的无线信标处于活动状态，目前还不清楚哪些网站有stream量以及他们正在使用哪个频道。我想看看“哇，这是两个最热闹的SSID，他们都在6频道，我会切换到12频道”或其他什么。我还想知道是否有人使用我们设置的一些节点..也许是孤儿。 Windows或Linux工具都可以。如果免费，我可以下载并运行它。有什么build议？谢谢！

Intereting Posts

数据库复制失败，但没有什么可怕的日志如何检测我是否可以访问FTP服务器上的资源？为apache2设置最大的服务器负载互联网连接速度对服务器查询的影响 Postfix：virtual_alias_maps尽pipe有新的域名，但把一切交给一个用户如何计划/触发Web部署工具来同步IIS Web服务器？端口镜像到Mac Thunderbolt以太网 $ PATH可以在红帽的非loginshell中定义我的SPFlogging应该如何设置，还是甚至有必要？无法激活Windows 2012r2 Standard 更新后是否需要删除旧证书？ SMTP错误“首先检查新邮件” 如何在mac os上的postgresql上安装fuzzystrmatch.sql pg_trgm.sql x 无法在Server 2008中创buildFTP Microsoft系统中心虚拟机pipe理器

Articles of 监控