我们使用的是来自nagios插件的check_log来监视日志,但问题在于,即使我们每小时轮换一次日志,大日志文件也会导致内存和CPU使用率出现明显的高峰。 这是因为check_log使用diff来比较旧版本的日志文件和当前版本。 问题是,没有检查所有check_log替代的来源,是否有任何不使用差异,但例如跟在最后检查的linenumber并从那里检查?
我们从服务器发送日志,并在每台服务器上使用logstash进行装运。 所以我们从glob "/root/Desktop/Logstash-Input/**/*_log"读取日志。 input { file{ path => "/root/Desktop/Logstash-Input/**/*_log" start_position => "beginning" } } 从这个glob我们从我们想要添加到事件的path提取字段 。 例如:从目录path提取server , logtype等。我们这样做: filter { grok { match => ["path", "/root/Desktop/Logstash-Input/(?<server>[^/]+)/(?<logtype>[^/]+)/(?<logdate>[\d]+.[\d]+.[\d]+)/(?<logfilename>.*)_log"] } } 然后我们使用lumberjack输出插件将这些日志输出到中央logstash服务器。 output { lumberjack { hosts => ["xx.xx.xx.xx"] port => 4545 ssl_certificate => "./logstash.pub" } stdout { codec => rubydebug } } 问题在于,运送到中央服务器的日志会丢失使用grok添加的字段。 例如中央服务器上不存在server , logtype等。 […]
其中一个由Zabbix监控的服务器无法访问。 我不知道为什么这与其他服务器正常工作。 被监控服务器上的zabbix-agent服务正在运行。 我们有几台服务器,全部由zabbix监控。 在/etc/zabbix/zabbix_agentd.conf我看到这个有问题的服务器和另一个正常工作之间没有区别。 zabbix服务器和受监视的服务器(代理服务器)都由Amazon托pipe。 所有zabbix受监控的服务器都链接到一个安全组,其中有两个入站规则,用于端口10050和10051,用于zabbix-server IP。 因此,应该允许从zabbix服务器到这些服务器上的zabbix代理的传入请求。 他们在几台服务器上工作,但不在这台服务器上。 zabbix-server具有不同的安全组,并且没有为端口10050和10051设置规则,所以它们应该被阻止。 Iptables不返回任何规则。 我可以从zabbix-server打开一个telnet会话到代理。 它自动断开连接,但连接。 所以我猜防火墙不是问题。 服务器:Amazon Linux(Centos like) 安装的文件: http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm : http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm 所有这些代理和服务器上的SELinux都被禁用。 zabbix-agent服务重启后的代理日志 10939:20151127:093938.268 Starting Zabbix Agent [agent-server.test]. Zabbix 2.2.11 (revision 56693). 10939:20151127:093938.268 using configuration file: /etc/zabbix/zabbix_agentd.conf 10942:20151127:093938.269 agent #1 started [listener #1] 10945:20151127:093938.269 agent #4 started [active checks #1] 10941:20151127:093938.270 agent #0 started […]
我正在使用项目vfs.fs.size[/bakcrypt,free] (由自动发现生成)监视encryption文件系统(当然还有其他)的磁盘空间。 encryption的文件系统在系统启动时不会自动挂载 ,因为必须手动input密码 。 问题是,虽然我的/bakcrypt还没有挂载vfs.fs.size[/bakcrypt,free]给出了“父”文件系统( / )的大小,这是错误的。 这会导致错误的触发器/警报和磁盘空间图中的跳转。 如果指定的文件系统当前没有挂载,有没有办法阻止vfs.fs.size给出结果? 还是有“合意expression”的手段? 像whenmounted(/bakcrypt,vfs.fs.size[/bakcrypt,free]) 。
我build立了一个Munin主节点,目的是监视不同种类的Unix机器。 我遵循了这封信的指示,发现尽pipe监控工作和所有的Linux节点完美无瑕,但我无法从FreeBSD中得到任何有意义的结果。 所有的节点都设置了一个运行的munin-node守护进程,一个用户在FreeBSD节点上的Linux节点和munin上调用munin-async 。 用户是这样设置的,以允许SSH连接: # /var/munin/.ssh/authorized_keys no-port-forwarding,no-X11-forwarding,no-agent-forwarding,no-pty,no-user-rc,from="1.2.3.4",command="/usr/local/share/munin/munin-async –spoolfetch" ssh-ed25519 AAAAC3Nza[…] 通过SSH手动连接按预期工作,直接丢弃到munin-async helper。 PTY allocation request failed on channel 0 # munin node at example.home.lan list cpu df fail2ban if_bge0 if_bge1 if_bridge0 if_errcoll_bge0 if_errcoll_bge1 if_errcoll_bridge0 if_packets_bge0 if_packets_bge1 if_packets_bridge0 intr_cpu iostat ip_drops ip_forwarding ip_host ipinput load lpstat memory netirq_bge0 netisr_arp netisr_ether netisr_igmp netisr_ip netisr_ip6 netisr_rtsock netmem_clusters […]
有人有灯监测经验? 我的意思是标准的监控和缓慢的查询监控mysql,虚拟主机加载以及。 并提醒如果事情进展不顺利。 仙人掌是非常酷的工具,但它没有警报系统,它非常巨大。 我喜欢zabbix,它的performance。 但是我找不到任何有关apache监控的注释或插件,一些需要* / server-status的工具会收集这些数据,为每个vhost收集数据并将其保存到zabbix数据库中,并用graphics绘制更多的机会=) 还有一些来自proc stat for mysql,为每个用户收集数据,他的统计数据,慢查询等等,与graphics作为结果=) 一定是这个工具是在任何地方,我只是无法find它…
任何人都可以uptime.exe来运行Windows Server 2008中的/ s或/ p:n开关,而不会崩溃? 我意识到这是一个NT工具,不再支持,但它在2003年工作正常。我听说有一个版本包含在服务器核心,所以我想知道是否在2008年更好的工作? 如果uptime.exe是一个不行,你用什么来获取系统可用性历史logging?
我有一些基于LSI Logic MPT芯片(特别是SAS1068E)的RAIDarrays服务器。 目前我知道获取磁盘状态的唯一方法是使用lsiutil程序并在交互式查看状态。 我希望能够通过cron作业或其他脚本来监视这一点,但似乎没有一个非交互模式lsiutil 。 人们用什么?
有什么好的工具可以用来找出哪些网站是我的Windows 2003 Web服务器资源中最大的漏洞? 服务器一直在慢慢爬行,我想知道哪些网站应该优先进行故障排除。
我目前在SQL Server 2005中的20多个数据库之后,需要一个工具来监视性能,并告诉我数据库是否运行缓慢。 有什么我可以在任何其他良好的第三方工具(免费)pipe理工作室内运行,可以做这项工作。 谢谢