监视服务器 Gind.cn

Nagios日志检查插件，不使用差异

我们使用的是来自nagios插件的check_log来监视日志，但问题在于，即使我们每小时轮换一次日志，大日志文件也会导致内存和CPU使用率出现明显的高峰。这是因为check_log使用diff来比较旧版本的日志文件和当前版本。问题是，没有检查所有check_log替代的来源，是否有任何不使用差异，但例如跟在最后检查的linenumber并从那里检查？

使用Logstash作为托运人？

我们从服务器发送日志，并在每台服务器上使用logstash进行装运。所以我们从glob "/root/Desktop/Logstash-Input/**/*_log"读取日志。 input { file{ path => "/root/Desktop/Logstash-Input/**/*_log" start_position => "beginning" } } 从这个glob我们从我们想要添加到事件的path提取字段。例如：从目录path提取server ， logtype等。我们这样做： filter { grok { match => ["path", "/root/Desktop/Logstash-Input/(?<server>[^/]+)/(?<logtype>[^/]+)/(?<logdate>[\d]+.[\d]+.[\d]+)/(?<logfilename>.*)_log"] } } 然后我们使用lumberjack输出插件将这些日志输出到中央logstash服务器。 output { lumberjack { hosts => ["xx.xx.xx.xx"] port => 4545 ssl_certificate => "./logstash.pub" } stdout { codec => rubydebug } } 问题在于，运送到中央服务器的日志会丢失使用grok添加的字段。例如中央服务器上不存在server ， logtype等。 […]

Zabbix代理无法访问

其中一个由Zabbix监控的服务器无法访问。我不知道为什么这与其他服务器正常工作。被监控服务器上的zabbix-agent服务正在运行。我们有几台服务器，全部由zabbix监控。在/etc/zabbix/zabbix_agentd.conf我看到这个有问题的服务器和另一个正常工作之间没有区别。 zabbix服务器和受监视的服务器（代理服务器）都由Amazon托pipe。所有zabbix受监控的服务器都链接到一个安全组，其中有两个入站规则，用于端口10050和10051，用于zabbix-server IP。因此，应该允许从zabbix服务器到这些服务器上的zabbix代理的传入请求。他们在几台服务器上工作，但不在这台服务器上。 zabbix-server具有不同的安全组，并且没有为端口10050和10051设置规则，所以它们应该被阻止。 Iptables不返回任何规则。我可以从zabbix-server打开一个telnet会话到代理。它自动断开连接，但连接。所以我猜防火墙不是问题。服务器：Amazon Linux（Centos like）安装的文件： http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm : http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm 所有这些代理和服务器上的SELinux都被禁用。 zabbix-agent服务重启后的代理日志 10939:20151127:093938.268 Starting Zabbix Agent [agent-server.test]. Zabbix 2.2.11 (revision 56693). 10939:20151127:093938.268 using configuration file: /etc/zabbix/zabbix_agentd.conf 10942:20151127:093938.269 agent #1 started [listener #1] 10945:20151127:093938.269 agent #4 started [active checks #1] 10941:20151127:093938.270 agent #0 started […]

Zabbix vfs.fs.size在文件系统未安装时会给出错误的结果

我正在使用项目vfs.fs.size[/bakcrypt,free] （由自动发现生成）监视encryption文件系统（当然还有其他）的磁盘空间。 encryption的文件系统在系统启动时不会自动挂载，因为必须手动input密码。问题是，虽然我的/bakcrypt还没有挂载vfs.fs.size[/bakcrypt,free]给出了“父”文件系统（ / ）的大小，这是错误的。这会导致错误的触发器/警报和磁盘空间图中的跳转。如果指定的文件系统当前没有挂载，有没有办法阻止vfs.fs.size给出结果？还是有“合意expression”的手段？像whenmounted(/bakcrypt,vfs.fs.size[/bakcrypt,free]) 。

Munin通过munin-asyncd监视FreeBSD客户端不起作用

我build立了一个Munin主节点，目的是监视不同种类的Unix机器。我遵循了这封信的指示，发现尽pipe监控工作和所有的Linux节点完美无瑕，但我无法从FreeBSD中得到任何有意义的结果。所有的节点都设置了一个运行的munin-node守护进程，一个用户在FreeBSD节点上的Linux节点和munin上调用munin-async 。用户是这样设置的，以允许SSH连接： # /var/munin/.ssh/authorized_keys no-port-forwarding,no-X11-forwarding,no-agent-forwarding,no-pty,no-user-rc,from="1.2.3.4",command="/usr/local/share/munin/munin-async –spoolfetch" ssh-ed25519 AAAAC3Nza[…] 通过SSH手动连接按预期工作，直接丢弃到munin-async helper。 PTY allocation request failed on channel 0 # munin node at example.home.lan list cpu df fail2ban if_bge0 if_bge1 if_bridge0 if_errcoll_bge0 if_errcoll_bge1 if_errcoll_bridge0 if_packets_bge0 if_packets_bge1 if_packets_bridge0 intr_cpu iostat ip_drops ip_forwarding ip_host ipinput load lpstat memory netirq_bge0 netisr_arp netisr_ether netisr_igmp netisr_ip netisr_ip6 netisr_rtsock netmem_clusters […]

由zabbix监视LAMP

有人有灯监测经验？我的意思是标准的监控和缓慢的查询监控mysql，虚拟主机加载以及。并提醒如果事情进展不顺利。仙人掌是非常酷的工具，但它没有警报系统，它非常巨大。我喜欢zabbix，它的performance。但是我找不到任何有关apache监控的注释或插件，一些需要* / server-status的工具会收集这些数据，为每个vhost收集数据并将其保存到zabbix数据库中，并用graphics绘制更多的机会=）还有一些来自proc stat for mysql，为每个用户收集数据，他的统计数据，慢查询等等，与graphics作为结果=）一定是这个工具是在任何地方，我只是无法find它…

uptime.exe在Windows Server 2008上崩溃

任何人都可以uptime.exe来运行Windows Server 2008中的/ s或/ p：n开关，而不会崩溃？我意识到这是一个NT工具，不再支持，但它在2003年工作正常。我听说有一个版本包含在服务器核心，所以我想知道是否在2008年更好的工作？如果uptime.exe是一个不行，你用什么来获取系统可用性历史logging？

监视LSI MPT磁盘状态

我有一些基于LSI Logic MPT芯片（特别是SAS1068E）的RAIDarrays服务器。目前我知道获取磁盘状态的唯一方法是使用lsiutil程序并在交互式查看状态。我希望能够通过cron作业或其他脚本来监视这一点，但似乎没有一个非交互模式lsiutil 。人们用什么？

如何找出哪些网站正在放慢我的服务器？

有什么好的工具可以用来找出哪些网站是我的Windows 2003 Web服务器资源中最大的漏洞？服务器一直在慢慢爬行，我想知道哪些网站应该优先进行故障排除。

SQL监视概述

我目前在SQL Server 2005中的20多个数据库之后，需要一个工具来监视性能，并告诉我数据库是否运行缓慢。有什么我可以在任何其他良好的第三方工具（免费）pipe理工作室内运行，可以做这项工作。谢谢

Intereting Posts

允许开发人员部署到服务器，但不能login（ssh）到服务器在Windows cmd中联网ARP表 Nagios RHEL 5.4 Linux设备名称：除了/ dev / cciss之外，还有哪些其他非标准存储设备名称 SA有或没有amavis新 – 什么更快？为服务器电源线select正确的AWG？如何在使用apache的托pipe网站的相同物理服务器上设置反向代理？思科IPSEC VPN速度慢亚马逊EC2有没有可以获得stream行的AMI的地方？升级Web服务器（Ubuntu）上的OpenSSH以实现PCI合规性如何识别在分区上运行的文件系统允许Chroot用户使用Pubkey或密码身份validation 如何在远程计算机上为XP安装MS修补程序？ bash中的特殊字符提示不起作用（彩色的用户名） pfctl udp NAT转发不工作

Articles of 监视