Articles of 监控

Nagios – 定义为一个组的所有成员的服务*除了一些主机?

我们正在使用nagios来检查我们的ssh服务器是否正在运行。 我们有为某个组的所有成员定义的check_ssh组。 我们还为该组定义了其他服务。 一切安好。 然而,对于这个组中的2个成员,他们在另一个端口上监听ssh。 所以我必须为他们做一个新的服务。 这很好,但后来nagios抱怨说我为相同的主机定义了两次SSH服务。 我可以更改原始的ssh服务以包括组A的所有成员,但排除主机X和Y?

员工监控软件

我正在寻找一个员工监控解决scheme,这将允许我们远程连接到我们的电脑,看看现场发生了什么,最好有一些loggingfunction,如快照,访问的url等… … 我浏览过networking,大部分我发现的软件都来自不知名的公司,有蹩脚的网站,让我觉得他们要么我想在我的电脑上安装病毒,要么骗我。 大多数人似乎也在网上种植了“评论”,很可能是自己写的。 基本上,任何人都有一个值得信赖的公司的经验来实现这一目标? 谢谢

什么是最佳/最差的监测系统?

这是其中唯一正确答案是“依赖”的一般性问题之一。 什么标准? 什么是监控? 可达性,可用性? 例如是一个链接向上/向下,主机是否响应ICMP等 服务? 例如是在正确的端口监听,是一个命名的服务运行等。 资源? CPU使用率? 例如总可能的百分比,累积时间,总数或每个程序。 磁盘使用情况? networking使用? 例如移入或移出的字节或数据包。 服务? 例如是在正确的端口监听,是一个命名的服务运行等。 服务或应用程序特定指标? 例如每秒数据库事务处理,发送或接收的SMTP消息等 监视元素是如何发现/添加/设置/configuration的? 有没有自动发现? 手动设置? 如何监测特定元素? 当地代理? 例如做周期性的“df”或“ps”或“ping” SNMP? JMX? windows性能计数器? 通知如何完成? 如控制台,电子邮件,寻呼机,短信,即时消息等 元素和通知如何分组和排列优先级? 例如,链接失败是否会为该链接后面的所有服务或可访问性元素设置通知? 还是只有一个? 或者它是可configuration的? 例如,主机故障是否会启动所有在那里托pipe的服务或应用程序的通知,以及缺less资源监视数据? 跟踪系统中是否有自动创build案例/票据/问题? 如何跟踪SLA指标?

用于监视多个基于Unix的系统的工具

什么是你build议的工具,以同时监测多个Unix(Linux和OSX专用)系统? 我需要实时监控CPU,内存和磁盘的使用情况,并希望使用单个工具来实现。

Nagios插件在负载较高时执行进程快照

我们已经通过NRPE插件configuration了带有check_load Nagios来监视服务器负载,当负载很高的时候它会报告,但是当时没有select进行快照的顶层进程(如top命令)。 有没有任何nagios NRPE插件?

通过SNMP跟踪Avaya呼叫量?

我们公司使用Avaya的IPOffice系统。 我们的通话量相对较小,但是我真的很想知道我们的高峰和低谷在哪里。 是否可以通过SNMP跟踪Avaya IPOffice设备上的通话使用情况? 以下是我所知道的: Avaya在pipe理员光盘(和网上 – http://www.oidview.com/mibs/6889/md-6889-1.html )上发布他们的SNMP库。 我已经通过他们看,但无法find我想要的。 Avaya确实有一个名为“系统状态”的程序,显示了我所关心的所有值,但我希望能通过我的主要SNMP系统进行跟踪。 我真正想知道的是以下一项或多项: 在我的24个可用的行中,目前有多less个正在使用? 现在有多less内部到内部的对话? 这些不使用我们可用的外部线路,但会很有趣跟踪。 目前有多less内部电话摘机?

如何检测虚拟机冻结

在云平台上,您经常会听到,由于相邻虚拟机的负载过高,超额订购的以太网磁盘,备份或实时迁移到其他硬件,虚拟机可能会“冻结”一会儿。 我怀疑这是发生在我们不希望公开耻辱的云提供商上的一个Ubuntu虚拟机上。 每天晚上都无法进行外部监测服务。 机器本身在负载,交通等方面看起来是健康的。提供商build议networking是好的,但。 我想能够(不)certificateVM冻结造成这些传呼机。 我想到的一个想法是每秒钟将date写入日志,在短暂的不可用时间之后,看看我们是否跳过了“节拍”。 然而,这似乎有缺陷,因为如果虚拟机保持自己的时钟,并允许从主机的硬件漂移。 如果我们的内部时钟与虚拟机一起冻结,那么我们在这个日志文件中仍然会有一个很好的秒数序列,而且现在实时的时钟已经落后了。 有没有更好的方法/工具,我可以用来确定有机器冻结? 我会猜想实时,我们的时间将是一个告诉,然后又有其他原因漂stream时钟。

Xen Dom0的性能和利用率监控

我们在公司内部运行Citrix XenServer和Gentoo / Xen虚拟化平台。 一般来说,我们使用XenServer共享存储(SAN,iSCSI或其他)和Gentoo / Xen,我们要使用本地存储。 使用XenServer,我们可以获得平台上Dom0和各个DomU的详细利用率统计信息。 我们还通过SNMP(Cacti)监视DomUs。 我们可以使用SNMP或SAR或其他任何方式从Gentoo / Xen Domus获得统计信息,但是我们无法从Dom0中获得良好的使用统计信息。 没有这个,我们无法评估我们如何有效使用硬件,以及何时需要考虑构build。 我相信这肯定是一个解决的问题,但是我的Google-Fu让我有些失望,所以我希望这里有人可能有一些想法。 干杯 戴夫

监视思科交换机上CAM表的大小

我们注意到一些stream出来的数据包从我们的交换机走出应该没有的端口。 在清除clear mac address-table清除凸轮表后,问题似乎消失了。 我们目前最好的理论是,桌子在某个时刻被淹没,导致转换器展现出这种中心的行为。 有谁知道是否可以通过SNMP监控表的大小,所以我们可以跟踪?

现场Linux监控电子邮件处理

是否有一个应用程序可以将所有的邮件处理步骤从连接链接到交付,从而显示整个过程和决策的实际情况? 我知道可以使用tail -f /var/log/mail.log,但是当连接和内部步骤(客户端授权,收件人授权,中继,反弹等等)变成大量的时候,这个日志会变得相当耗时,消耗和容易缺less步骤。 我在想有点像“顶”,但电子邮件。 例如 从1.2.3.4连接 客户端拒绝/接受,邮件来自,到 收件人地址已validation/退回 政策检查,反垃圾邮件,防病毒。 转达/传递给… 然后可以像顶部一样显示: CONNECT FROM TO POLICY DELIVERY RESULT example.com [1.2.3.4] [email protected] [email protected] OK Maildir 2.5.0 OK spam.com [1.2.4.5] [email protected] [email protected] SBL Fail Reject 5.7.1 Deny 1.2.4.6 NO_FQDN Reject 4.7.1 Retry (不要过分简化) 此外,这可以用来build立/存储邮件接受/拒绝的统计数据,这可以反过来用来发现意外的错误configuration。 有没有人看过像这样的东西?