我有monit一个进程,但它并没有意识到它是失败的。 我的监视configuration是这样的: check process xxx with pidfile /var/run/xxx.pid group yyy start program = "/etc/init.d/xxx start" stop program = "/etc/init.d/xxx stop" if failed host 127.0.0.1 port 9999 then restart if 5 restarts within 5 cycles then timeout 问题是即使我的进程已经崩溃,PID文件仍然存在。 所以… PID存在,但本地主机端口9999应该失败。 所以…是否期望monit不重新启动这个过程? 应该删除pid文件吗? 不能做那样的OR ? 提前致谢,
我想监视我的高峰networking使用情况。 我已经使用munin在5分钟的样本中监测networkingstream量。 但是,由于我们有很多高峰的httpstream量只能持续几秒钟,我想知道在过去5分钟内每秒峰值networking使用率 ,而不是平均值。 目前我使用的是易于查看高峰使用情况的iftop 。 但是iftop只能交互式运行。 我使用屏幕来运行,并可以定期查看它。 如何使用iftop或类似的工具,每5分钟logging一次最近5分钟的networking峰值使用情况。 我只需要一个像这样的线的文件: 2014-06-17 15:43:12 TX: 14,3 MBit/s RX: 16,2 MBit/s Sum: 29,6 MBit/s 2014-06-17 15:48:12 TX: 11,3 MBit/s RX: 12,2 MBit/s Sum: 22,3 MBit/s 等等。 我试过ntop但是这是相当多的开销,我不能轻易地将数据导入munin。 而且它没有写出每5分钟的峰值。 有没有人知道这个工具或有效的脚本?
我有一个Debian Wheezy VPS盒子,在生产中运行一对Django应用程序。 理想情况下,将尝试通过优化应用程序,添加更多的RAM或增加Swap来解决我当前的内存占用问题。 但问题是,我怀疑从优化Django应用程序(该堆栈是开源的和强大的),我会牛奶内存优化,添加内存是一个成本约束(我是一个远程VPS),也是,主机不提供使用Swap的选项! 所以,在此期间(当我等待获得更多的资源以支付更多的RAM时),我希望减轻服务器耗尽内存的情况,以便我只需要重新启动VPS(就像在那个时候,我甚至不能SSH进入框!)。 所以,我喜欢的解决scheme是能够检测一个进程(或者一般来说,系统总内存使用情况)是否超过某个临界值(现在,例如FREE RAM降低到10%) – 我已经注意到在VPS长时间运行之后,还有一些重量级应用程序突然出现stream量(大多数情况下只是应用程序的升级)。 所以,我希望能够杀死/重新启动违规程序(最有可能的Apache)。 在这些情况下手动完成哪个解决scheme恢复了理智的内存使用级别 – 暗示可能有一个或多个Django应用程序有内存泄漏? 简单来说: 监视整个系统的RAM使用情况 如果我们从当前的日志分析(使用linux-dash)假设Apache经常是违法者,那么在释放RAM低于给定的临界阈值(例如低于10%)时,杀死/重新启动违规进程 – 或者更简单一些,然后杀死/重新启动它。 冲洗并重复…
我已经浏览了一些相关的问题,但想要更具体些。 这就是我所希望的: Linux机器(虚拟机,无论) 运行可以执行系统日志和仪表板的应用程序 从Juniper和其他非CISCO设备获取信息(使用SNMP或其他) 提供实时图表和报告 通知支持/故障排除 网页界面 所有开源或免费 现在的警告 。 我知道NAGIOS和Groundworks以及Zenoss,甚至在过去曾试图搞乱他们。 问题是我是一个Windowspipe理员,Linux的经验非常有限。 所以,当涉及到交钥匙或演练以外的任何事情时,它就会很快地冒险。 我最终会因为学习曲线太高而特别是当您不知道Linux命令足以正确排除故障和configuration时,将其报废。 所以任何人都可以推荐一个快速简单的解决scheme,让我和上述(记住注意事项)?
有哪些OSS监控解决scheme? 我只知道nagios和仙人掌。 有没有真正的现场表演监测工具?
我的公司开始为我们的客户提供托pipe服务协议,这意味着我们在客户站点远程pipe理小型服务器集群。 我们pipe理的主机位于客户防火墙之后,我们的访问是通过VPN进行的。 这适用于故障排除或交互式任务。 但是,我不确定如何pipe理监控。 我可以写一堆监控脚本,当出现问题时给我发电子邮件。 不过,我宁愿使用一个“真正的”监控框架(例如,我最熟悉的Nagios),这样可以使我对所有客户站点的健康情况有一个统一的看法。 但是我不知道我该怎么做,因为我想监视的站点只能通过VPN访问 – 为了监视起见,不断地维持VPN连接是不实际的。 我有兴趣听到任何想法。
如何在nginx中发生500错误时让pipe理员注意到?
是否有一个监测服务来监测我的网站从全球不同的位置? 像网站性能和可用性监控? 一个目标是find路由问题和性能瓶颈。 注:付费服务也很好! 重要的是,一项服务在一个包裹中提供不同的地点。
我不是一个服务器人,但是需要监视我的Web服务器的日志。 最好是PHP,Apache和MySQL错误日志。 您可以提供任何build议,免费的基于Web的解决scheme来监视这些服务器日志? 这是一个Linux服务器。
我需要在Linux服务器上做一些负载分析,并想要一个好的GUI来帮助我。 我不需要任何奇特的历史,日志logging或警报。 我需要比顶部更多的信息,并希望它包裹在一个非常困难的实用程序或包中。 就像Windows上的Process Explorer: 统计 全局,单个进程和单个线程均可查看 中央处理器 用法 内核时间,用户时间 上下文切换Delta 中断三angular洲 DPC Delta 手柄 主题 stream程 记忆 虚拟内存 工作集 私人的 页面错误 I / O networking/磁盘分离 总计/增量读取/写入 打开套接字,文件句柄