服务器 Gind.cn

服务器问题集锦,包括 Linux(Ubuntu, Centos,Debian等)和Windows Server服务器

Sensu每处理180次

我安装了最新的sensu-core,并使用omnibus软件包安装了sensu-plugin gem。 Sensu运行起来并没有问题,但我遇到了处理程序的主要问题。 我已经设置了社区插件的标准ruby mailer.rb,以及pagerduty处理程序。 当我添加处理程序到一个检查,我知道是在日志中失败我看到这个: {\"id\":\"a1e807d2-425f-4891-b291-ed5bda5b6105\",\"client\":{\"name\":\"mfp\",\"address\":\"25.147.26.157\",\"subscriptions\":[\"test\"],\"version\":\"0.20.0\",\"timestamp\":1437673191},\"check\":{\"command\":\"/etc/sensu/plugins/check-disk.sh -d /dev/md1 -w 80 -c 90\",\"interval\":10,\"handlers\":[\"default\",\"pagerduty\",\"mailer\"],\"occurrences\":3,\"subscribers\":[\"test\"],\"name\":\"disk\",\"issued\":1437673279,\"executed\":1437673201,\"duration\":0.01,\"output\":\"CRITICAL – /dev/md1 space used=94% | '/dev/md1 usage'=94%;80;90;\\n\",\"status\":2,\"history\":[\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\",\"2\"],\"total_state_change\":0},\"occurrences\":513,\"action\":\"create\"}"]} {"timestamp":"2015-07-23T12:41:20.873279-0500","level":"info","message":"handler output","handler":{"type":"pipe","command":"/etc/sensu/handlers/pagerduty.rb","api_key":"2e24c101ef754ff6add39aaaffa846c9","name":"pagerduty"},"output":["only handling every 180 occurrences: ws/disk\n"]} {"timestamp":"2015-07-23T12:41:20.873561-0500","level":"info","message":"handler output","handler":{"type":"pipe","command":"/etc/sensu/handlers/pagerduty.rb","api_key":"2e24c101ef754ff6add39aaaffa846c9","name":"pagerduty"},"output":["only handling every 180 occurrences: wwv/disk\n"]} {"timestamp":"2015-07-23T12:41:21.055407-0500","level":"info","message":"handler output","handler":{"type":"pipe","command":"/etc/sensu/handlers/pagerduty.rb","api_key":"2e24c101ef754ff6add39aaaffa846c9","name":"pagerduty"},"output":["only handling every 180 occurrences: mfp/disk\n"]} 因此,处理程序正在触发,但是被sensu-handler.rb gem过滤,而不是创build电子邮件或pagerduty事件。 这是违规的路线 only handling every 180 occurrences 有谁知道问题是什么? 这是一个错误? 我是否需要重写某些内容? 我为这个特殊的检查(check_disk)发生了大量的事件,所以应该向pagerduty和邮件发送。

不稳定的10Gb铜缆链路,Broadcom和Intel卡到Cisco 4900M交换机

我们购买了一些带有QLogic / Broadcom BCM57810 PCI Express卡的戴尔PowerEdge R730服务器,并将它们连接到思科4900M交换机–10Gb链路无法可靠工作。 他们有时候不会连接,有时会在几分钟后连接,当他们连接时,他们每天会下降几次。 断开连接可以持续4分钟或2小时。 思科交换机现有的10Gb铜缆链接到戴尔PowerVault SAN,已经稳定并且可以工作数月。 我看到VMware日志中的断开连接如下所示: bnx2x 0000:82:00.1: vmnic5: NIC Link is Down 和 network connectivity on virtual switch "vSwitch2". Physical NIC vmnic5 is down. 我看不到任何有用的错误代码或之前的消息,只有链接引起的消息下降。 在Windows上,它显示为断开连接的卡,在交换机上显示为断开连接的交换机端口。 当链接连接时,它们工作 – 巨型帧ping,iSCSI会话build立,数据存储显示所有find的path。 但连接是间歇性的。 我们检查了: 电缆: 原来是Cat5e单电缆,现在是Cat6结构化布线。 电缆总长度<7米。 连接一根新的电缆,主机可以在没有任何连接点和接点的情况下进行切换,也不需要连接其他线缆 司机/操作系统: 最初的VMware ESXi 5.5 U2戴尔构build(“ESXi 5.5.0,2068190”)与bnx2x驱动程序版本2.710.39.v55.2 然后从vmware.com更新驱动程序,bnx2x版本2.710.70.v50.7 然后,ESXi 6.0,戴尔build立(“ESXi 6.0.0 2494585”),它具有bnx2x版本2.712 … 然后使用戴尔网站的最新驱动程序Windows […]