监控服务器 Gind.cn

服务器监控警报？

可能重复：你用什么工具来监视你的服务器？我想监视我的服务器，并得到警报，当它（平/networking服务器）你推荐哪个应用程序？（我正在使用Ubuntu 10）我知道nagios，但它需要我在我的服务器上安装nagios，我需要一个更简单的解决scheme，没有任何安装在我的服务器上。

监视MySQL的工具，即使请求崩溃了服务器

经常发生我的服务器停机（从几分钟到总是）。我想我设法find了这个问题，位于MySQL需要大量的RAM做请求，但由于服务器没有响应，我无法连接到SSH来分析它。有没有一个工具可以保存到一个文件中，每个动作由mysql做出，每个请求，它的大小，使用的内存，cpu等等我想find哪个请求导致我的服务器每周下降大约一次/两次：谢谢你的帮助！

linux系统资源分析器

我有一台运行php，apache，node.js和mysql的debian 5机器。我希望有一些报告生成软件能够显示cpu，内存使用情况和networkingstream量。一些简单的graphics和Web界面将是最佳的。能够在每个进程或每个服务的基础上做到这一点也是非常好的。

什么是networking服务的正确监控策略？

以一个用nagios和check_mk监控的主机为例。现在有运行的http和ssh服务器。什么是最好的监测策略：监视sshd＆apache进程是否正在运行尝试从监视主机连接到正确的端口，例如22和80 尝试从外部networking连接到端口80 我不想得到大量的警报：当主机closures时（check_mk无法连接）当我的networking出现问题时（服务实际上可以从其他networking获得）所以我想知道背后的监控策略和理论。因为我不只是想要多次重复检查，只是产生大量无用的警报。监控力求达到什么样的目标？我已经用check_mk部署了nagios，执行了500多个检查。这是一个普遍的问题，如何规划您的支票，并实现良好的覆盖面（如果你喜欢监测解决scheme无关）。

如何确定上周两个小时资源使用率高的原因？

我知道有几种工具可以用来查明是什么原因导致networking和CPU使用率过高，但是我经常在服务器上检查日志，注意到networking/ CPU活动时间非常长。最近一次发生在上周的某一天。我怎样才能“回头看”，找出谁或什么在使用这些资源，而不是“在行为中捕捉他们”？我使用Ubuntu 10.04。

Bind9统计文件的不同可能的格式

我正在尝试使用Appaloosa模板为我们的DNS服务器添加一些性能监视，但是看起来，由bind9创build的统计文件的格式（ statistics-file "/var/log/named/stats.txt"; config）在Ubuntu上与Appaloosa脚本所期望的不同。我们的开始是这样的： +++ Statistics Dump +++ (1328102269) ++ Incoming Requests ++ 728403022 QUERY ++ Incoming Queries ++ 330347117 A 27 NS 169974 SOA 1548490 PTR 350886 MX 4 TXT 395986483 AAAA 37 IXFR 4 ANY ++ Outgoing Queries ++ [View: default] 2182086 A 132 NS 1592702 PTR 552138 MX 10 TXT 2220781 […]

SNMP（UDP）代理

我在一家中型电信公司工作，负责networking监控解决scheme。我们有一个自定义的监控系统，主要是使用SNMP与设备进行通信。问题是我们偶尔需要添加额外的轮询服务器，每次我们必须在每个支持SNMP的设备上更新10k + ACL以添加新的IP地址。由于服务器位于不同的数据中心，具有不同的L3连接，因此无法事先预测。这对我们的行动来说是艰苦的工作，他们对此不满意。我的问题：是否有任何SNMP或UDP代理，我们可以在一个主机上安装，并通过它转发每个SNMP请求到设备？

我无法login到Nagios Web界面

当我尝试在我的网页浏览器中loginNagios，并在我的Nagios页面http://127.0.0.1/nagios/反复input我的login名和密码后，我得到这个：需要授权此服务器无法validation您是否有权访问请求的文档。要么提供了错误的凭据（例如错误的密码），要么您的浏览器不知道如何提供所需的凭据。 Apache / 2.2.15（红帽）服务器在127.0.0.1端口80 我改了密码： htpasswd -c /etc/nagios/htpasswd.users nagiosadmin 并重新启动服务器： service httpd restart 但没有结果！

Linuxnetworking监控

在一台服务器上，我目前正在经历奇怪的应用程序行为，这似乎都与networking问题有关。问题的例子： applicationA检测到与serverB的连接中断，但serverB仍然将连接视为已打开 applicationA对web服务器进行soap web服务调用，serverC永远不会收到soap请求，但是applicationA不会超时或错误。你怎么去调查这些问题呢？关于第一个问题，我知道应该总是有3个连接向serverB打开，所以我只是简单地进行监视， netstat | grep IP_serverB 这可以检测到连接丢失，但我想调查为什么这些连接丢失。你会怎么做？你需要安装哪些工具？我知道我们的一个合作伙伴，似乎监视所有通过其服务器的stream量，并能够提供给我们的数据包跟踪文件（.pcap文件）。你怎么设定的？这有助于调查问题吗？

Nginx 504监控

我正在使用Nginx来反向代理一个nodejs实例，当一个外部服务试图调用一个特定的，安全的api端点时，这个实例会超时，产生504个错误。如何设置Nginx通知我（即通过电子邮件）当它服务于504？由于有问题的api端点是安全的，并且依赖于传递的特定信息，所以通用监视解决scheme将不起作用。我很惊讶，我没有find任何明确的信息后，如何做到这一点，谷歌search15分钟后。谢谢。

Intereting Posts

后缀警告：pipe_command_write：超出写入时间限制刀片服务器比普通机架式服务器嘈杂吗？ DOS打印机文本输出在“新”计算机上有错误的字符 Adaptec的“maxCache”和“Hybrid RAID”技术有什么区别？ Munin通过munin-asyncd监视FreeBSD客户端不起作用不能访问网站间歇性，网站不可用获得IP电话交换机@相同的Cisco交换机如何在Linux上的Tomcat 7中添加符号链接作为webapp到webapps？ Nginx及其caching系统。他们都一样吗？ x64的Windows报告32GB内存可用的64GB内存安装 – 为什么？由Sendmail发送的电子邮件有不寻常的超时确保正向代理连接傀儡DNS查询的最低udp源端口是什么？运行部署时出现GAClocking问题如何区分EventID 4768中的用户和计算机 – Active Directory？

Articles of 监控