我们的监控办公室里有一大堆高清电视,关注着我们所有的生产设备。 我们正在监控: 思科路由器 惠普交换机 惠普公司的服务器 Windows 2003 IIS SQL服务器 目前我们使用 Nagios的正常运行时间/可用性和警报发送 仙人掌带宽使用 在Vista上运行Perfmon以获得服务器性能 其他工具和我们自己的自定义代码的组合来监视我们的实际应用程序性能。 除了Perfmon部分之外,所有这些都是很好的 – 它给了我们我们想要的东西 – 例如屏幕上的实时图表,logging某些性能指标等 – 唯一的问题是设置它是一件非常麻烦的事情。 如果运行Perfmon的Vista电脑重新启动(通常是由于Windows更新),那么再次设置所有的计数器会花费很长时间 – 对于办公室里的某个人来说,花费一两个小时的工作量。 任何人都知道以下两种方法之一:1.添加Perfmon计数器的脚本2.另一个带graphics输出和WMI / Windows计数器访问的工具。 谢谢 麦克风
有没有很好的技术来监控群集上的cron任务? 我们开始每天使用cron来启动任务。 关于检查信息的一些想法: 添加特殊的应用程序处理,将信息logging到一些“networking感知”的地方,如数据库 build立一个日志文件系统,定期传输cron日志到一个中心点进行处理/查询(以及其他可能的日志文件) 我想知道人们是否已经成功地将cron与其他东西分开处理,或者如果这些任务被完全整合到另一种方法中。 我倾向于#2,但我想知道更多有经验的人可能会尝试。
我们有3个专用服务器,使用openVZ分割成几个VPS。 我们使用munin来监控生产站点的VPS,并监控某个VPS,以确保在发生故障时重新启动服务。 事情是,我们需要一个更好的方式来监视我们的所有服务器,因为我们有多达14个VPS,我们希望有一个中心中心,我们不仅可以看到由慕尼黑收集的数据,而且还有一些额外的统计数据在我们的服务的networking和performance。 我们的一些要求: – 短信通知失败(能够设置特定的自定义validation) – 日志分析器的Apache的error_log和其他一些。 – 必须是中央(意味着一个服务器和几个节点收集数据)。 – 不需要易于安装,但易于维护。 – 需要自由 我已经指出了尼吉欧斯和stream氓,你怎么看? 谢谢,
我只想监视less量的服务器(less于10个)。 从阅读各个地方,听起来像顶级领先的竞争者(至less对于开源)是: Nagios的 穆宁 ZABBIX 从我读过的很多人往往一起使用munin和nagios – munin的历史和graphics,nagios警报。 另一方面,这听起来像Zabbix是比其他两个更完整的解决scheme,更容易configuration。 所以我正在考虑走那条路。 我现在的想法是: Zabbix的一般缺点是什么? Zabbix在监视的盒子上有小的尺寸吗? 我真的需要为它设置一个完整的其他服务器吗? 我目前有一个很轻的负载下的服务器 – 我可以双重目的吗?
我正在寻找一个工具来从Linux命令行testing一个网站。 从输出结果中,我需要知道http响应(状态码),同时也需要testing下载网站不同元素的时间。 先谢谢你。
在nagios中定义和testing新服务时,我已经重新启动了nagios,然后单击服务,并尽快重新安排检查,然后等待检查发生。 有没有更有效的方法来做到这一点? 我想使用命令行来运行特定的检查并得到输出。
我们使用尾部来连续监视几个日志,但是当一个日志被旋转时,那个文件的尾部将会停止。 据我所知,问题是,当日志旋转,有一个新的文件创build,运行尾进程不知道任何关于新的文件句柄。
我正在寻找一种诊断问题的方法,比如交换死亡,在这个过程中,一个内存溢出的进程填满swap并杀死整个机器(比如apache)。 我已经在使用仙人掌,而且我可以设置nagios(虽然宁可不)或者munin,但是据我所知,他们不能logging单个程序的使用情况 – 只是总体状态。 我知道我可以每隔30秒将一个脚本滚动到某个文件,但是我想看看现有的成熟解决scheme是否已经存在。 再一次,理想情况是: 每N秒logging进程的内存使用情况 每N秒logging进程的CPU使用情况 支持图表和历史 支持平均值 – 比如mysqld在最后一天使用了43%的CPU,平均值为400MB的内存 自由和开源 进程名不是,也不应该事先知道 – 这个想法是让它监视,然后看看顶尖的罪犯。 我的系统是Linux(OpenSUSE)。
我刚刚在服务器上安装了Windows Server 2008,我可以通过远程桌面进行连接,但无法ping通。 我是否需要在防火墙上打开特殊端口才能ping通服务器?
我最近发现了Shinken ,这是一个使用Python的Nagios的新实现。 Shinken将Nagios分为5种不同types的守护进程,每个守护进程执行单独的任务。 我还没有尝试过,但是对于我所看到的,整个架构的想法对我来说似乎很棒(它以Unix的方式工作:一个进程,一个任务),但是这个项目似乎有点“绿色”了。 那么有没有人试过Shinken? 你怎么看?