可能重复: 你用什么工具来监视你的服务器? 我想监视我的服务器,并得到警报,当它(平/networking服务器)你推荐哪个应用程序? (我正在使用Ubuntu 10)我知道nagios,但它需要我在我的服务器上安装nagios,我需要一个更简单的解决scheme,没有任何安装在我的服务器上。
经常发生我的服务器停机(从几分钟到总是)。 我想我设法find了这个问题,位于MySQL需要大量的RAM做请求,但由于服务器没有响应,我无法连接到SSH来分析它。 有没有一个工具可以保存到一个文件中,每个动作由mysql做出,每个请求,它的大小,使用的内存,cpu等等 我想find哪个请求导致我的服务器每周下降大约一次/两次: 谢谢你的帮助!
我有一台运行php,apache,node.js和mysql的debian 5机器。 我希望有一些报告生成软件能够显示cpu,内存使用情况和networkingstream量。 一些简单的graphics和Web界面将是最佳的。 能够在每个进程或每个服务的基础上做到这一点也是非常好的。
以一个用nagios和check_mk监控的主机为例。 现在有运行的http和ssh服务器。 什么是最好的监测策略: 监视sshd&apache进程是否正在运行 尝试从监视主机连接到正确的端口,例如22和80 尝试从外部networking连接到端口80 我不想得到大量的警报: 当主机closures时(check_mk无法连接) 当我的networking出现问题时(服务实际上可以从其他networking获得) 所以我想知道背后的监控策略和理论。 因为我不只是想要多次重复检查,只是产生大量无用的警报。 监控力求达到什么样的目标? 我已经用check_mk部署了nagios,执行了500多个检查。 这是一个普遍的问题,如何规划您的支票,并实现良好的覆盖面(如果你喜欢监测解决scheme无关)。
我知道有几种工具可以用来查明是什么原因导致networking和CPU使用率过高,但是我经常在服务器上检查日志,注意到networking/ CPU活动时间非常长。 最近一次发生在上周的某一天。 我怎样才能“回头看”,找出谁或什么在使用这些资源,而不是“在行为中捕捉他们”? 我使用Ubuntu 10.04。
我正在尝试使用Appaloosa模板为我们的DNS服务器添加一些性能监视,但是看起来,由bind9创build的统计文件的格式( statistics-file "/var/log/named/stats.txt"; config)在Ubuntu上与Appaloosa脚本所期望的不同。 我们的开始是这样的: +++ Statistics Dump +++ (1328102269) ++ Incoming Requests ++ 728403022 QUERY ++ Incoming Queries ++ 330347117 A 27 NS 169974 SOA 1548490 PTR 350886 MX 4 TXT 395986483 AAAA 37 IXFR 4 ANY ++ Outgoing Queries ++ [View: default] 2182086 A 132 NS 1592702 PTR 552138 MX 10 TXT 2220781 […]
我在一家中型电信公司工作,负责networking监控解决scheme。 我们有一个自定义的监控系统,主要是使用SNMP与设备进行通信。 问题是我们偶尔需要添加额外的轮询服务器,每次我们必须在每个支持SNMP的设备上更新10k + ACL以添加新的IP地址。 由于服务器位于不同的数据中心,具有不同的L3连接,因此无法事先预测。 这对我们的行动来说是艰苦的工作,他们对此不满意。 我的问题:是否有任何SNMP或UDP代理,我们可以在一个主机上安装,并通过它转发每个SNMP请求到设备?
当我尝试在我的网页浏览器中loginNagios,并在我的Nagios页面http://127.0.0.1/nagios/反复input我的login名和密码后,我得到这个: 需要授权 此服务器无法validation您是否有权访问请求的文档。 要么提供了错误的凭据(例如错误的密码),要么您的浏览器不知道如何提供所需的凭据。 Apache / 2.2.15(红帽)服务器在127.0.0.1端口80 我改了密码: htpasswd -c /etc/nagios/htpasswd.users nagiosadmin 并重新启动服务器: service httpd restart 但没有结果!
在一台服务器上,我目前正在经历奇怪的应用程序行为,这似乎都与networking问题有关。 问题的例子: applicationA检测到与serverB的连接中断,但serverB仍然将连接视为已打开 applicationA对web服务器进行soap web服务调用,serverC永远不会收到soap请求,但是applicationA不会超时或错误。 你怎么去调查这些问题呢? 关于第一个问题,我知道应该总是有3个连接向serverB打开,所以我只是简单地进行监视, netstat | grep IP_serverB 这可以检测到连接丢失,但我想调查为什么这些连接丢失。 你会怎么做? 你需要安装哪些工具? 我知道我们的一个合作伙伴,似乎监视所有通过其服务器的stream量,并能够提供给我们的数据包跟踪文件(.pcap文件)。 你怎么设定的? 这有助于调查问题吗?
我正在使用Nginx来反向代理一个nodejs实例,当一个外部服务试图调用一个特定的,安全的api端点时,这个实例会超时,产生504个错误。 如何设置Nginx通知我(即通过电子邮件)当它服务于504? 由于有问题的api端点是安全的,并且依赖于传递的特定信息,所以通用监视解决scheme将不起作用。 我很惊讶,我没有find任何明确的信息后,如何做到这一点,谷歌search15分钟后。 谢谢。