监视服务器 Gind.cn

Snort性能监视

使用snort版本2.8.6，我试图收集应用程序性能统计信息，如由于应用程序过载而未处理的数据包数量处理图层的时间百分比（预处理器，重组，模式匹配等）处理的数据包数量等等目前我正在使用perfmonitor预处理器来转储性能统计信息，并通过SNMP调用来绘制其中一些值。关于这个预处理器的文档是相当有限的，并且不能很好地解释这些字段实际上是什么意思，或者数字计算的时间框架。为了获得这些性能指标，我应该关注哪些领域以及如何衡量这些领域？

寻找短暂的TCP连接所有者进程

运行本地连接到apache服务器的tcpdump ，我发现TCP连接正在build立，并且每2秒立即closures一次。我如何find哪个进程负责这些？ netstat -ctp没有帮助，连接速度太快，进程标识符不显示TIME_WAIT的。他们原来是haproxy探针，我可以用strace来validation，但是我仍然不知道如何确定haproxy。

获取CPU /内存使用情况的历史logging

有没有办法logging任务pipe理器有关CPU和内存使用情况的信息以供日后检查？或者一个等效的工具？

如何设置监控磁盘空间

我在我的服务器上使用监视来监视Apache和MySQL的运行。现在我想添加一个警报，如果磁盘得到太满。我在/etc/monit/monitrc添加了这个testing： check device rootfs with path /dev/md0 if space usage > 10% then alert 我有两个分区我想检查： /和/var ： mount /dev/md0 on / type ext3 (rw) /dev/md2 on /var type ext3 (rw) 除了磁盘空间之外，在这个configuration中有什么有用的检查？

地理分布，容错和“智能”应用程序/主机监视系统

问候，我想问一下集体对分布式监控系统的看法和看法，你用什么，你知道哪些可能会打我的箱子？要求相当复杂; 没有单点故障。真。我死了严重！需要能够容忍单个/多个节点故障，既“主”和“工人”，你可能会认为没有监控位置（“网站”）有多个节点，或在同一networking。因此这可能排除了传统的HA技术，如DRBD或Keepalive。分布式逻辑，我想在多个networking，多个数据中心和多个大陆上部署5个以上的节点。我想从我的客户的angular度来看待我的networking和应用程序的“鸟眼”视图，当您拥有50多个节点，甚至500多个节点时，监控逻辑的积分不会陷入停滞状态。需要能够处理相当合理数量的主机/服务检查，la Nagios，假设每个主机有1500-2500个主机和30个服务。如果增加更多的监控节点，可以相对线性地进行扩展，这可能是非常好的，也许在5年的时间里，我可能希望每个主机监控5000个主机和40个服务！从上面关于“分布式逻辑”的说明中join，可以很好地说：在正常情况下，这些检查必须在$ n或n％的监视节点上运行。如果检测到故障，则运行另一个$ n或n％节点的检查，将结果关联起来，然后使用它们来决定是否满足条件来发出警报。图表和pipe理友好的function。我们需要跟踪我们的SLA，并知道我们的“高可用性”应用程序是否全天候运行是有用的。理想情况下，您提出的解决scheme应该尽可能less地使用“开箱即用”的方式进行报告。必须有一个坚实的API或插件系统来开发定制支票。需要对警报有所了解。我不想一定知道（通过短信，在凌晨3点）一个监控节点认为我的核心路由器已经closures。我确实想知道他们中有一定比例的人是否同意某些事情正在发生;）我在这里谈论的基本上是“法定人数”的逻辑，或者是对分散的疯狂的适用。我愿意考虑商业和开源的select，虽然我宁愿避开费用数百万英镑的软件:-)我也愿意接受，可能没有什么东西在那里打勾所有这些盒子，但想问集体那个。在考虑监视节点及其位置时，请记住，其中大部分将是随机ISPnetworking上的专用服务器，因此在很大程度上超出了我的控制范围。依靠BGP提供和其他复杂networking滑稽的解决scheme可能不适合。我还应该指出，过去我曾经评估，部署过或大量使用/定制过大多数开放源代码风格，包括Nagios，Zabbix和朋友 – 它们确实不是坏的工具，但总的来说，它们是平坦的“分布式“方面，特别是关于我的问题和”智能“警报中讨论的逻辑。很高兴澄清任何要点。欢呼伙计和加尔斯:-)

常见的WQL监视查询

您将使用哪些WQL查询来监视典型的Windows瓶颈？你会用什么来获得类似于“顶”或“净”的数据？你会在什么时间间隔？这里有一些我觉得有帮助的。 SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface

替代etsy / statsd

有没有其他的etsy的statsd ？也许甚至是一个完整的仪表盘式解决scheme？我的研究只find专有的SaaS解决scheme。对于那些不知道的人：statsd是一个通过UDP收集应用程序和系统指标的deamon，并将它们发送到Graphite以生成或多或less漂亮的地块。有一个所有重要的语言可用的API。我需要：必须在我的服务器上运行，而不需要第三方收集数据应该能够从系统，Java和Perl收集数据应该是轻量级和灵活的 FOSS 可能需要额外的编程，可能只是一个框架

监视，跟踪和分析有什么区别？

我已经看到这三个词出现了很多，但不明白它们之间的确切区别。例如，收集CPU利用率通常称为性能分析，也可能属于性能监控。他们之间（微妙的）区别是什么？

日志传输和聚合的规模

你如何从UNIX / Linux机器上分析日志文件？我们运行几百台服务器，它们都可以直接或通过系统日志生成自己的日志文件。我正在寻找一个体面的解决scheme来汇总这些并挑选重要的事件。这个问题分解成三个部分： 1）消息传输经典的方法是使用syslog将消息logging到远程主机。这适用于login到syslog的应用程序，但对写入本地文件的应用程序不太有用。解决scheme可能包括让应用程序login到连接到程序的FIFO中，使用syslog发送消息，或者写一些grep本地文件并将输出发送到中央系统日志主机。但是，如果我们去编写工具来把消息写入系统日志的麻烦，我们会更好地用像Scribe这样的东西来代替整个系统，它比syslog提供更多的灵活性和可靠性。 2）消息聚合日志条目似乎分为两种types：每个主机和每个服务。每主机消息是在一台机器上发生的消息; 认为磁盘失败或可疑的login。运行服务的大多数或全部主机上都会出现每个服务的消息。例如，我们想知道Apache何时发现一个SSI错误，但是我们不希望100台机器发生同样的错误。在所有情况下，我们只希望看到每种消息types之一：我们不希望10条消息说同一个磁盘失败了，而且每次遇到一个破坏的SSI都不需要消息。解决这个问题的一个方法是将多个相同types的消息聚合到每个主机上，将这些消息发送到中央服务器，然后将相同types的消息聚合成一个整体事件。 SER可以做到这一点，但使用起来很尴尬。即使在几天的摆弄之后，我也只有基本的聚合工作，并且不得不经常查找SER用于关联事件的逻辑。它function强大但棘手：我需要一些我的同事可以在最短的时间内拿起和使用的东西。 SER规则不符合要求。 3）生成警报当有趣的事情发生时，我们如何告诉我们的pipe理员？邮件收件箱？注入Nagios？那么，你是怎么解决这个问题的？我不期望在盘子上有答案。我可以自己搞清楚细节，但是一些高层次的讨论肯定是个普遍的问题。目前我们正在使用cron作业，系统日志和谁知道还有什么可以find事件。这不是可扩展的，可维护的或灵活的，因此我们错过了许多我们不应该做的事情。更新：我们已经在使用Nagios进行监控，这对于检测到主机/testing服务/ etc是非常好的，但是对于抓取日志文件不太有用。我知道有Nagios的日志插件，但是我对比每个主机警报更具可扩展性和层次感的东西感兴趣。

我如何被动地监视Windows事件日志？

如何远程监控Windows事件日志，以便在发生特定事件时自动通知我？有很多主动的监控解决scheme，但需要人们的关注或不断的投票。我需要一个被动的解决scheme，当一个特定的事件发生时，它只会产生一个通知

Intereting Posts

如何重写Apache 2中反向代理页面中引用的资源的根位置？ tcpdump中“未知的SSAP”和“未知的DSAP”是什么意思？我有问题在Windows Server 2008 r2上安装SQL Server 2008 R2。它给了我以下错误侦察 – 任何人使用它？为什么memcached占用的内存比configuration中指定的多得多在httpd.conf中使用别名读取networking驱动器的Apache问题使用PHP-FPM的Apache2 / PHPconfiguration的安全性在Red Hat / CentOS集群中可以使用哪些应用程序？如何在IIS7中获得有意义的错误消息？如何使用PERC 5 / i在PowerEdge 2900中更新X25-E SSD固件为什么我的scp只在一边工作？ “丢失连接”SCP转移正则expression式在HAProxy的资产pipe理reqrep 暴露服务器正常运行时间潜在的安全漏洞？将文件包含在Apache HTTP服务器版本2.2 httpd.conf中密码保护有线局域网？

Articles of 监视