我正在调查一个运行着许多oracle数据库实例的linux服务器上的极端负载 (但CPU,IOWAIT,SYS,磁盘/networking活动较低)的奇怪情况 。 当在机器上加载一些cpu时,一切看起来都很正常,正如我们在vmstat中看到的那样: procs ———–memory———- —swap– —–io—- –system– —–cpu—– 2 0 193312 1959440 403368 38270032 0 0 2504 25 4660 3916 16 5 78 1 0 1 0 193312 1899352 403560 38277932 0 0 2198 1720 5175 4675 14 5 79 2 0 1 3 193312 1878992 403584 38279024 0 0 13900 14261 2054 […]
我们的服务器有多个硬盘并运行多个进程。 我们有一个磁盘的磁盘利用率很高,我想找出导致这个问题的哪个进程。 我使用iotop命令,但它不会被磁盘过滤,并且它有一个很大的输出。 我用nmon ,只是说我们在磁盘上有很多读取io。 如何通过硬盘过滤进程并按io使用进行sorting? 操作系统:Ubuntu 14.04
在一个shell脚本中,我们目前调用/usr/sbin/pcs status cluster ,然后用grep -qE查找'Current DC:.*partition with quorum' grep -qE 'Current DC:.*partition with quorum'来确定集群是否正常。 我想知道是否有一个更快的方法,因为pcs status cluster查询所有节点的PCSD状态,这需要时间,大约一秒半,我想做这个检查之前做某些操作是要经常做。 pcs status nodes both并计算在线节点的数量是同样好决定如果群集没有问题? 这大约需要2秒钟: pcs status cluster 2>&1 | grep -qE 'Current DC:.*partition with quorum' pcs status cluster 2>&1 | grep -qE 'Current DC:.*partition with quorum' 这需要约0.2秒: pcs status nodes both | grep -cE 'Online: [az]+ [az]+ […]
我正在尝试使用Nagios(3.0.1)监视MSMQ队列计数器。 远程服务器正在运行NC_Net。 check_commandconfiguration如下所示: check_command check_nt!COUNTER!-l "\\MSMQ Queue(servername\\private$\\queuename)\\Messages in Queue","%.f messages in MSMQ queue" -w 5 -c 10 这不起作用。 我相信美元符号需要逃脱,而且在解决问题方面遇到困难。 这篇文章build议“$$”即。 check_command check_nt!COUNTER!-l "\\MSMQ Queue(servername\\private"$$"\\queuename)\\Messages in Queue","%.f messages in MSMQ queue" -w 5 -c 10 但是这不起作用。 我已经尝试了一些其他的方法(反斜杠,单引号等)。 有什么build议么? 编辑: 我一直在通过命令行进行一些testing,这是我认为这是造成问题的原因之一。 以下工作: ./check_nt -H hostip -v COUNTER -l "\\MSMQ Queue(Computer Queues)\\Messages in Queue","%.f messages in MSMQ queue" […]
我们承载了许多Win 2008服务器,现在我意识到商业带宽监视工具,但是我知道有一些像NetMon等Windows服务器可用的networking工具,我不知道如何使用它们,我相信Windows 2008 Web Edition应该有一些内置的工具..否则,我们必须真正去买一个..
我正在使用GroundWork (一种基于Nagios的监视框架)通过SNMP监视一些networking设备,但是我仍然遇到了带宽使用问题。 大多数路由器,包括这里使用的Cisco 2800,都可以通过SNMP查询networkingstream量信息; 然而,他们以计数器的forms返回这个信息,意思是“自打开路由器以来有多less字节进入或离开给定的接口”。 所以,为了从这些信息中获得一些有意义的东西,你需要每秒钟查询这些信息,看看每个度量与前一个度量有什么不同。 Groundwork / Nagios可以自动pipe理这些性能数据,因为它们使用RRD来存储这些数据,RRD支持计算值之间的增量。 但是如何在带宽使用超过一定限度时产生警报? 只有当一个值高于给定阈值时,Nagios才能发送警报,而不是基于同一个值的两个不同度量之间的差异。 我需要一种方法来检查带宽使用是否超过了一定的阈值,如果发生这种情况,会生成Nagios警报(从而发送电子邮件)。 我不能仅仅依靠pipe理员查看性能数据来查看networking带宽是否有问题。
Twitter今天的新闻都被DNSredirect/劫持黑客攻击。 我的问题是,你们用什么工具或技术来监视你的DNS / whois并检测到这种攻击?
我正在寻找一个(可能)桌面应用程序来实时监控通过JMX的应用程序。 应用程序必须提供使用图表和仪表devise具有来自多个JMX查询的值的仪表板的function。 如果值超出阈值,我必须能够设置某些值的阈值,并用声音提醒。 应用程序将始终运行在我们手术室的大显示器上。 Nagios,Hyperic等传统的监控应用程序在我的“实时”需求中并不适合。 他们也非常擅长维护监控或警报的历史,但缺乏一个好的和快速的GUI。 我的预算是200美元,但免费和开源始终是首选。 我有一些时间来定制它。
如何使用Nagios监控思科IPsec VPN? 我想检查用户是否可以连接到VPN。
我正在寻找一个工具来总结每个节点的WiFistream量。 我并不是在寻找像嗅探包这样的奇特的东西……所发送的实际数据是无关紧要的。 我想要一种方法来看到SSID Alpha是活跃的,有100kbs的活动,SSID Beta是活着的没有活动,等等。 如果列出了每个SSID的802.11types(a,b,g,n?)和频道号,则可以获得奖励。 如果每个networking的活动在过去一小时/一天/星期内有一个图表,或者至less有一些累加的粗略字节被传输,则为奖励。 我试图解决的问题是,在我们的大楼里有太多的无线信标处于活动状态,目前还不清楚哪些网站有stream量以及他们正在使用哪个频道。 我想看看“哇,这是两个最热闹的SSID,他们都在6频道,我会切换到12频道”或其他什么。 我还想知道是否有人使用我们设置的一些节点..也许是孤儿。 Windows或Linux工具都可以。 如果免费,我可以下载并运行它。 有什么build议? 谢谢!