Articles of 系统监控

Windows的进程跟踪工具

Process Explorer可以显示当前正在运行的进程,也可以显示每个进程已经启动的命令行。 是否有一种工具可以捕获在工具运行各自的命令行时启动和完成的一系列进程?

什么是最好的方法来检查基于Debian的服务器的健康状况

你好我一直在想如何定期检查一个系统来评估系统的健康状况。 我真的变成一个系统pipe理员,我已经pipe理了10台ubuntu servers 。 我已经build立了zabbix,但我相信无论是我自己还是脚本都应该每个月运行一次以检查服务器。 它是如何在现实生活中完成的? 如果是的话,有什么方法可以实现呢? 有什么build议任何人觉得与年轻的系统pipe理员分享? 谢谢你的build议

Icinga2 HA上设备的依赖性

我想在Icinga2上configuration一个主机到主机的依赖关系,但是其中一个主机有一个HAconfiguration,所以我只需要在两个HA设备都closures的情况下触发它。 假设这种情况: 假设我在Icinga2上拥有所有这些设备。 很明显,广域网交换机对两台路由器都有依赖性,所以我只想避免在两台路由器都closures的情况下监控广域网交换机。 我在Icinga2文档上找不到这样的东西。 任何人有最好的方式来设置这个想法?

Nagios通知间隔和第一个通知延迟

我曾经在Nagios中使用过这两个参数(first_notification_delay,notification_interval),直到现在为我完美工作。 现在我已经添加了使用nrpe命令的新检查。 上述两个参数不受影响。 我每隔十​​分钟就会收到一封电子邮件。 我必须改变主机nsclinet.cfg文件上的任何东西吗? 我正在使用的服务定义是 define service { use generic-win-logfile host_name RuleS_TI_E405,RuleS_TI_E464 service_description check_logfilesSmsDispatcher_Process check_command check_nrpe!check_logfilesSmsDispatcher_Process } 它embedded了以下服务模板: define service{ name generic-win-logfile active_checks_enabled 1 passive_checks_enabled 0 parallelize_check 1 obsess_over_service 1 check_freshness 0 notifications_enabled 1 event_handler_enabled 1 process_perf_data 0 retain_status_information 1 retain_nonstatus_information 1 is_volatile 1 check_period 24×7 max_check_attempts 3 normal_check_interval 10 ; check every 5 […]

GNOME系统监视器保存时间线

我使用GNOME系统监视器,我喜欢它显示的graphics。 问题是我想logging那个图表大约一个小时或者一天,这样我就可以全面了解我的系统在那段时间的performance。 有人可以帮助我如何保存graphics信息或至less信息? 提前致谢。

APM系统如何监控和收集机器交互?

所以我通常理解像New Relic这样的.NET应用程序 – CLR Profiler API是非常有意义的。 但我不明白的是,AppDynamics是如何理解服务器和仪器之间的关系,而不是实际上基于.NET的东西..任何人都可以阐明这些东西如何在内部工作?

如何设置一个nagios事件处理程序只在非工作时间运行?

我有一个事件处理程序configuration和运行在每次给定的服务处于CRITICAL状态触发的nagios。 问题是,我们决定在正常工作时间内不需要运行事件处理程序,因为我们可以通过手动和更高效的方式解决问题。 问题是,有没有什么办法可以设置这个事件处理程序只运行在一个给定的时间周期,但通常情况下通知CRITICAL状态? 我们说在非工作时间? 在此先感谢您的帮助。

监控很多网站的软件

可能重复: 你用什么工具来监视你的服务器? 任何人都可以推荐网站监测服务? 我公司为我们的客户build立和维护网站。 在任何给定的date,我们有400-600个网站活跃。 我们每周build立5-10个类似的数字。 我们已经为每个站点启用了基本的“现场实时”监视,但是我想扩展它。 在我们build立自己的之前,我正在寻找build议。 监控将围绕每个站点而不是服务器(所有站点都在负载平衡的物理服务器池上运行)。 对于每个网站,我们要监控不同类别的信息,例如: 注册项目:域名到期,SSL证书过期。 这些数据来自现场检查。 实现清单:通过数据库查询和/或发出HTTP请求检查数据,并将结果HTML与正则expression式进行比较 性能指标:访问,转换等数据查询检查数据。 由于我们经常添加/删除网站,我们需要通过API或其他自动化方式添加和删除网站。 我看了一下Nagios , Icinga和Zenoss 。 虽然这些扩展插件和API,物理主机上的每个中心。 我们真的需要能够一目了然地查看哪些突出显示有问题的网站,然后深入查看问题所在。 有没有find我需要的工具? 有没有人以非服务器为中心的方式使用其中的一种?

跨服务器和自定义应用程序的自定

我希望能够解决这个问题的一半是Nagios,但我只是想检查一下我们在基础架构和自定义应用程序方面的特定要求。 我们需要监控下面列出的自定义事件: 如果在特定文件夹中存在超过30分钟的.CSV或.TXT,则发出警报 警告如果特定的POP3邮箱有超过3个项目在那里 一个特定的文件夹应该每天有一个1700的模式“standard_file_name_ddmmyy”的文件 一个XML文件应该在每天早上0300以前,在周末除外。 本质上,它是监视不同的文件相关的活动,否则很难保持。 有什么build议么?

有没有办法将顶部作为守护进程来收集历史stream程数据?

我知道我可以编写一个cron作业,它将以批处理模式运行,并将输出写入一个文件,但是我正在寻找比这更优雅的东西。 另外我知道sysstat(萨尔),但我正在寻找更详细的过程数据。 有这样的事情吗?