Articles of 监视

自动化一系列Perfmon计数器

我正在研究一个特定的设置来解决我们的具体需求: 我有一个由3台机器组成的实验室,负责运行负载testing并根据需要监督其他调查。 在负载testing期间,我们有负载testing收集所有相关的统计信息(如磁盘计数器和CPU使用率数据)。 但是,在负载testing之外,我们目前还没有办法完成以下两项任务: 允许我们收集详细的硬件计数器 允许我们以合理的方式组织这些 允许我们监视服务器的运行pipe理(主要是剩余的磁盘空间) 所以现在我正在评估几个不同的选项。 有些是有偿的,其他人是… Perfmon。 它会给我我想要的细节,它会将数据推送到SQL数据库中,并且对于剩余的磁盘空间警报,它也可以很好地与Windows警报一起使用。 它也可以远程工作。 所以这里是我目前的设置: 一个Windows Server 2008 R2 – 指定“监视” 实验室机器 在“监视”框中,我运行Perfmon,并将所有要收集的计数器添加到GUI中的“性能监视”窗口。 这花了大约20分钟,因为有很多我想要收集的SQL Server计数器。 我无法从任何Data Collection集合模板或其他任何东西导入这些计数器,因为这些计数器必须实际在Performance Monitor窗口中运行,然后可以使用数据收集模板来组织数据收集集。 它现在运行的很好,并且将数据精美地input到SQL Server中…但是最初的设置令人不安。 我们可能需要定期停止/启动/重新启动这个监控服务器,如果每次需要花费20-30分钟的时间来设置计数器,那么这也是一个问题。 我的问题是:是否有任何方法来自动化Perfmon收集的计数器,因为它们分布在3个远程机器上? 请注意,Perfmon实际上并不是“连接到远程计算机”我只是在perfmon计数器中注意到不同的计算机名称。

如何在CentOS上安装auditd?

如何在CentOS 6.4 x64上安装auditd? 我想要logging所有由pipe理员运行的命令在生产服务器上loggingpipe理员运行的所有命令编辑:我无法运行aduditd服务 我做了这个tut 在这里input链接描述 sudo yum install audit sudo chkconfig auditd on 将这两行添加到/etc/audit/audit.rules -a exit,always -F arch=b64 -F euid=0 -S execve -a exit,always -F arch=b32 -F euid=0 -S execve 我运行了一些命令,没有auditd目录login/ var / log / 现在审计不起作用,我不能得到运行服务。 在消息日志中我得到这个 Sep 7 18:05:40 vesoljedomen auditd[6777]: Started dispatcher: /sbin/audispd pid: 6779 Sep 7 18:05:40 vesoljedomen audispd: No plugins […]

晚上closures监控警报

我有监控24/7/365监控,并发送警报到一个电子邮件地址和文字信息平等的手机。 不过,我现在想在晚上停止电话短信,所以他们不叫我起床。 我不能让手机静音,因为我们正在紧急呼吁任何可能需要我们的亲属。 我将在后面找出如何在任何时候“无法重新启动服务器”的短信。 我有这个在我的monitrc文件中: set alert [email protected] set alert [email protected] 所以我想通过添加类似于下面的东西(在单个服务“检查进程”文件中起作用)closuresvtext.com警报, not every "* 23,0-6 * * *" 任何想法如何实现? 谢谢,罗恩

可以使用Perfmon监视(安装的)SMB共享上的可用空间吗?

有没有办法使用Windows Perfmon来监视(安装的)SMB共享上的可用空间? 例如:在服务器ABC ,我将安装共享\\DEF\SharedFiles 。 由于我无法在服务器DEF上设置任何监视,因此我想使用Perfmon观察位于服务器DEF上的SharedFiles共享上的可用空间。 SMB共享看起来似乎没有被LogicalDisk计数器报告,而在SMB Client Shares中没有看到任何可用于报告可用空间的计数器。

如何使用Nagios的check_http检查包含Hash的URI的内容?

尝试 check_http -H www.example.com -f follow -p 8080 -u /hello/#/world -s "content" 结果 HTTP WARNING: HTTP/1.1 404 Not Found – X bytes in 0.00X second response time |time=0.00XYZ 分析 虽然已经有多个源文件被读取[ 1,2,3,4 ]和一个Wget,即wget www.example.com:8080/hello/#/world返回OK,但是check_http是否不起作用还不清楚。 也许#是造成一个问题。 根据这个文档 , #是一个锚,这意味着如果var x表示x是#/world ,但是这无助于解决问题。 使用wget下载www.example.com ,随后检查worldbutton,指示此button与JavaScript源相关联。 这个发现也没有帮助解决这个问题。 尝试两个 check_http -H www.example.com -f follow -p 8080 -u /hello/\#/world -v 结果二 GET […]

监控Linux系统调用(高效)

监控linux系统调用并将其logging到文件的最快方法是什么? 这篇文章有一些很好的信息: https://security.stackexchange.com/questions/8485/monitoring-system-calls-in-a-reliable-and-secure-way?lq=1 看起来审计子系统是要走的路,问题是,当你监视所有的系统调用( auditctl -a exit,always -S all )你的操作系统变得太不知所措,一切工作缓慢。 在audit.rules增加缓冲区大小没有多大帮助。 有没有其他方式可以提供合理的性能,不会窒息操作系统? 我正在考虑编写我自己的内核模块,它将使用LSM api来挂钩系统调用。 你认为它会做得更好,审计子系统(使用许多filter/格式,可能会增加不必要的开销)

如何找出普罗米修斯LevelDB中存储的时间序列数

我负责维护我们公司的普罗米修斯服务器。 但是这些指标是由团队提供的。 有没有办法找出存储在Prometheus数据库中的时间序列的数量? 我们正在使用默认的LevelDB数据存储。 我需要这些值来确定是否需要调整我们的Prometheus实例的本地存储设置。 谢谢你的帮助。

将由Monit收集的系统信息logging到本地日志

我在Ubuntu 14.04服务器上configuration了Monit 5.6版本。 有几个检查像文件系统使用情况,远程主机连接检查和服务监控。 现在,当我查看monit的web gui时,我看到类似的东西; 现在,有许多默认显示的参数。 负载平均,CPU,内存等。我希望所有这些在一个日志文件,以便我可以运送指标到Elasticsearch。 但是,当我检查日志文件时,它显示如下; 如何将日志显示在web gui上的所有指标logging到日志文件中?

系统中心:代理程序代理

Specific Error: Agent proxying needs to be enabled for a health service to submit discovery data about other computers. Microsoft.SystemCenter.DiscoveryWriteActionModule.AgentProxyingNotEnabled.Alert 我们使用Microsoft System Center 2007.pipe理服务器引发此错误。 我已经启用代理每条指令,但唉,错误重新发生。 有没有其他人有这个,并修复它? 或者我只是禁用显示器?

如何监控Nagios中的Microsoft SQL群集可用性?

我们在集群设置中运行一个旨在与Microsoft SQL Server集成的系统。 目前我们在Nagios下都有数据库节点的监控,除了数据库主机检查外,一切正常。 check_tcp -H $ HOSTADDRESS $ -p 1433 可能不能像这样直接监视故障转移群集。 我应该如何监视集群的数据库可用性呢?