我在munin.conf中设置了警报 contacts user1 user2 user3 user4 contact.user1.command mail -s "Munin notification" [email protected] contact.user2.command mail -s "Munin notification" [email protected] contact.user3.command mail -s "Munin notification" [email protected] contact.user4.command mail -s "Munin notification" [email protected] contact.user1.always_send critical contact.user2.always_send warning critical contact.user3.always_send warning critical contact.user4.always_send critical 但是,当任何参数达到警告或临界阈值时,这可能会向我发送通知。 有没有办法只为一组特定的参数设置警报,在我的情况下,我只想设置它:CPU利用率,内存利用率,负载平均和磁盘利用率 不幸的是,慕尼黑的文件对此没有提及。
我想调整nagios的方式,所有的检查停止(服务不显示,或显示为未知)的任何下降节点。 换句话说,我只想看到一个closures主机的警报,而不是1(下)+ n(每个服务1)。 请注意,我对服务显示/状态感兴趣,不仅在closures通知。 理由:我们使用nagios firefox / chrome插件来监视状态,并且nagios的行为太吵,给出这样的读数(因为每个节点有20个服务): 3 down, 1 unreachable, 4 warnings, 87 critical 这意味着上级节点上的7个关键服务(问题出在服务上)被淹没在一堆红色的服务中,这些红色的服务仅仅是因为他们坐落在一个不可用的节点上。 我想看到的是: 3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical 甚至 3 down, 1 unreachable, 4 warnings, 7 critical 我查看了服务依赖关系,但是我没有办法描述:“在主机检查状态下在活动主机依赖关系上创build所有服务”。 我发现这里讨论的问题,其中一个参与者认为这是一个nagios错误,并在这里其中一个参与者认为这是“devise”。 事实上,我只是对效果感兴趣,更不用说devise理念。 请注意,这个nagios正在检查数百个节点,所以解决scheme的维护性也很重要。 TIA和欢呼声。
当我在我们的一台服务器上查看top时,有很多使用CPU的nfsd进程: PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 2769 root 20 0 0 0 0 R 20 0.0 2073:14 nfsd 2774 root 20 0 0 0 0 S 19 0.0 2058:44 nfsd 2767 root 20 0 0 0 0 S 18 0.0 2092:54 nfsd 2768 root 20 0 0 0 […]
我们正在GCP上构build数据pipe道,并selectBigtable作为原始事件的数据仓库。 我的问题是 – 我找不到正确监视群集的方法。 仪表板提供了有限的指标,如果有任何方法将它们连接到StackDriver,没有太多的麻烦,就可以做到这一点,就像GCP上的所有其他服务设置一样。 有没有可能用Stackdriver监控Bigtable? 如果没有,是否有另一个build议的方法来实现这一目标? 我发现这篇文章解释了如何获得对Bigtable运行的请求的报告,但是当试图接收关于整个集群健康状况的大图时,这并没有帮助。
我试图捕获所有的networkingstream量,并以可读的方式查看它。 用netsh开始数据包捕获,我正在运行以下命令。 netsh trace start scenario=NetConnection capture=yes report=yes persistent=no maxsize=1024 correlation=yes traceFile=net-trace.etl 然后,我使用QuickPHP来托pipe一个表单,它需要一个用户名和密码并将其发布到自身。 跟踪然后停止与netsh trace stop 。 要检查捕获的stream量,运行以下命令。 netsh trace convert input=net-trace.etl output=net-trace-dump.txt dump=txt 当我读取转储的stream量时,条目无法理解,我看不到127.0.0.1上的QuickPHP服务器的stream量。 另外,当我将.etl文件导入Microsoftnetworking监视器时,stream量会聚集成一个团块,并且仍然无法findQuickPHPstream量。 我已经能够运行与Microsoftnetworking监视器的捕获,并看到QuickPHPstream量。 如何使用NETSH来捕获networkingstream量并以类似于从Microsoftnetworking监视器捕获的方式在转储的文本文件或Microsoftnetworking监视器中查看? 非常感谢您的帮助!
我们有一个Windows桌面应用程序需要一直运行(100%正常运行时间)。 它在Windows Server 2012上运行,除了一个讨厌的问题,运行时,应用程序继续运行(在任务pipe理器和资源监视器上可见),但其中的主要定时器线程已经停止,本质上没有做其核心工作。 只有应用程序UI是可见的。 令人惊讶的是,这个exception甚至没有在日志中捕获,日志生成刚刚停止。 所以日志监控技术无法在这里工作。 我们正在解决这个问题,但我们想监视/确保内部桌面应用程序正在工作。 我正在计划使用一个心跳URL来监视它,这个URL将在每个Timer事件触发时被这个桌面应用程序使用。 它会通知监视服务器(心跳URL主机)“我还活着”。 如果N分钟没有收到心跳,则会生成通知。 我的问题是,这是正确的方法? 上述目的是否有任何现成的付费/免费工具? 鉴于我们无法使用外部监控服务在内部监控应用程序,我想到了这一个解决scheme。
我们正在开始规划一个基于networking的应用程序,该应用程序将允许用户pipe理我们大学各个部门的最终用户的自动启动/closures和基于Web的唤醒局域网控制。 这将是一个集中的服务与由本地支持人员pipe理的系统进行交互。 作为系统的潜在用户,我觉得从用户的angular度来看,对于所需function的处理非常好,但是我希望IT专业人员(尤其是Windows商店)能够提供一些反馈意见,本地IT支持人员可能希望从系统中获得。 我们将在当地收集信息,但我认为越多越好。
任何人使用Python脚本来监视Windows机器上的CPU使用情况? 我谷歌了一段时间,但一直没能find任何可用的脚本。 你能告诉我一些你正在使用的例子吗? 这是我得到的错误。 回溯(最近一次通话最后): 文件“test.py”,第1行,在 导入wmi 文件“c:\ Python26 \ lib \ site-packages \ wmi.py”,第141行, 从win32com.client中导入GetObject,Dispatch ImportError:没有名为win32com.client的模块
晚上好, 正如我在第一个向这个伟大的社群提出的问题中所提到的,由于世界经济问题,我在索尼devise公司工作时被解雇了。 我目前正在作为一个系统pipe理员,为一个小公司做VoIP。 我必须做的大多数事情是从我的家庭办公室(我只需要照顾1台服务器)开始,我使用的是运行Windows 7的24“iMac。我使用这台机器进行C#开发和RDP到用于监控和VoIPconfiguration的服务器。 由于工作性质,我必须全天候在家,但我不想一直被困在我的家庭办公室,所以我已经向我的老板介绍了让一个Note / Netbook当我离开办公室(拜访家人,周末等)时,做一些远程监控,他们已经同意了。 我的问题是,我应该得到什么? 我应该与便携性,并获得一个上网本和牺牲处理能力? 以下是我将要做的活动: RDP来监视服务器并做一些configuration 电子邮件 IM Microsoft Office相关的东西(Excel,PowerPoint) 也许Visual Studio 2008 有没有其他人在这样工作? 你在使用10英寸屏幕时有什么麻烦? PS。 我会很感激,如果你能推荐我一个很好的工作机器,无论是上网本或笔记本电脑。 更新 我主要关心的是我们购买了一些由于“可用性”而不得不快速更换的东西。 根据公司的计划,我可能会爬上“职位阶梯”,并与他们一起做其他事情。 如果他们聘请一个新人来做我现在做的事情,而我给他提供一个上网本,那么他可能并不适合他。 这就是为什么我要在小型便携式上网本或全面的15.4“笔记本电脑之间进行辩论。
我试图监视我们的MySQL服务器是否启动。 我正在使用的命令是: mysqladmin ping 它会返回以下内容: mysqld is alive 这只是检查进程是否正在运行,还是检查服务器是否正在接受连接?