Articles of 监视

Snort性能监视

使用snort版本2.8.6,我试图收集应用程序性能统计信息,如 由于应用程序过载而未处理的数据包数量 处理图层的时间百分比(预处理器,重组,模式匹配等) 处理的数据包数量 等等 目前我正在使用perfmonitor预处理器来转储性能统计信息,并通过SNMP调用来绘制其中一些值。 关于这个预处理器的文档是相当有限的,并且不能很好地解释这些字段实际上是什么意思,或者数字计算的时间框架。 为了获得这些性能指标,我应该关注哪些领域以及如何衡量这些领域?

寻找短暂的TCP连接所有者进程

运行本地连接到apache服务器的tcpdump ,我发现TCP连接正在build立,并且每2秒立即closures一次。 我如何find哪个进程负责这些? netstat -ctp没有帮助,连接速度太快,进程标识符不显示TIME_WAIT的。 他们原来是haproxy探针,我可以用strace来validation,但是我仍然不知道如何确定haproxy。

获取CPU /内存使用情况的历史logging

有没有办法logging任务pipe理器有关CPU和内存使用情况的信息以供日后检查? 或者一个等效的工具?

如何设置监控磁盘空间

我在我的服务器上使用监视来监视Apache和MySQL的运行。 现在我想添加一个警报,如果磁盘得到太满。 我在/etc/monit/monitrc添加了这个testing: check device rootfs with path /dev/md0 if space usage > 10% then alert 我有两个分区我想检查: /和/var : mount /dev/md0 on / type ext3 (rw) /dev/md2 on /var type ext3 (rw) 除了磁盘空间之外,在这个configuration中有什么有用的检查?

地理分布,容错和“智能”应用程序/主机监视系统

问候, 我想问一下集体对分布式监控系统的看法和看法,你用什么,你知道哪些可能会打我的箱子? 要求相当复杂; 没有单点故障。 真。 我死了严重! 需要能够容忍单个/多个节点故障,既“主”和“工人”,你可能会认为没有监控位置(“网站”)有多个节点,或在同一networking。 因此这可能排除了传统的HA技术,如DRBD或Keepalive。 分布式逻辑,我想在多个networking,多个数据中心和多个大陆上部署5个以上的节点。 我想从我的客户的angular度来看待我的networking和应用程序的“鸟眼”视图,当您拥有50多个节点,甚至500多个节点时,监控逻辑的积分不会陷入停滞状态。 需要能够处理相当合理数量的主机/服务检查,la Nagios,假设每个主机有1500-2500个主机和30个服务。 如果增加更多的监控节点,可以相对线性地进行扩展,这可能是非常好的,也许在5年的时间里,我可能希望每个主机监控5000个主机和40个服务! 从上面关于“分布式逻辑”的说明中join,可以很好地说: 在正常情况下,这些检查必须在$ n或n%的监视节点上运行。 如果检测到故障,则运行另一个$ n或n%节点的检查,将结果关联起来,然后使用它们来决定是否满足条件来发出警报。 图表和pipe理友好的function。 我们需要跟踪我们的SLA,并知道我们的“高可用性”应用程序是否全天候运行是有用的。 理想情况下,您提出的解决scheme应该尽可能less地使用“开箱即用”的方式进行报告。 必须有一个坚实的API或插件系统来开发定制支票。 需要对警报有所了解。 我不想一定知道(通过短信,在凌晨3点) 一个监控节点认为我的核心路由器已经closures。 我确实想知道他们中有一定比例的人是否同意某些事情正在发生;)我在这里谈论的基本上是“法定人数”的逻辑,或者是对分散的疯狂的适用。 我愿意考虑商业和开源的select,虽然我宁愿避开费用数百万英镑的软件:-)我也愿意接受,可能没有什么东西在那里打勾所有这些盒子,但想问集体那个。 在考虑监视节点及其位置时,请记住,其中大部分将是随机ISPnetworking上的专用服务器,因此在很大程度上超出了我的控制范围。 依靠BGP提供和其他复杂networking滑稽的解决scheme可能不适合。 我还应该指出,过去我曾经评估,部署过或大量使用/定制过大多数开放源代码风格,包括Nagios,Zabbix和朋友 – 它们确实不是坏的工具,但总的来说,它们是平坦的“分布式“方面,特别是关于我的问题和”智能“警报中讨论的逻辑。 很高兴澄清任何要点。 欢呼伙计和加尔斯:-)

常见的WQL监视查询

您将使用哪些WQL查询来监视典型的Windows瓶颈? 你会用什么来获得类似于“顶”或“净”的数据? 你会在什么时间间隔? 这里有一些我觉得有帮助的。 SELECT PercentDiskTime, AvgDiskQueueLength, DiskReadBytesPerSec, DiskWriteBytesPerSec FROM Win32_PerfFormattedData_PerfDisk_PhysicalDisk SELECT Caption, CommittedBytes, AvailableBytes, PercentCommittedBytesInUse, PagesPerSec, PageFaultsPerSec FROM Win32_PerfFormattedData_PerfOS_Memory SELECT PercentProcessorTime FROM Win32_PerfFormattedData_PerfOS_Processor SELECT Caption, WorkingSet, PageFaultsPerSec,IOReadBytesPerSec, IOWriteBytesPerSec, ThreadCount, HandleCount FROM Win32_PerfFormattedData_PerfProc_Process SELECT Caption, BytesReceivedPerSec, BytesSentPerSec FROM Win32_PerfFormattedData_Tcpip_NetworkInterface

替代etsy / statsd

有没有其他的etsy的statsd ? 也许甚至是一个完整的仪表盘式解决scheme? 我的研究只find专有的SaaS解决scheme。 对于那些不知道的人:statsd是一个通过UDP收集应用程序和系统指标的deamon,并将它们发送到Graphite以生成或多或less漂亮的地块。 有一个所有重要的语言可用的API。 我需要: 必须在我的服务器上运行,而不需要第三方收集数据 应该能够从系统,Java和Perl收集数据 应该是轻量级和灵活的 FOSS 可能需要额外的编程,可能只是一个框架

监视,跟踪和分析有什么区别?

我已经看到这三个词出现了很多,但不明白它们之间的确切区别。 例如,收集CPU利用率通常称为性能分析,也可能属于性能监控。 他们之间(微妙的)区别是什么?

日志传输和聚合的规模

你如何从UNIX / Linux机器上分析日志文件? 我们运行几百台服务器,它们都可以直接或通过系统日志生成自己的日志文件。 我正在寻找一个体面的解决scheme来汇总这些并挑选重要的事件。 这个问题分解成三个部分: 1)消息传输 经典的方法是使用syslog将消息logging到远程主机。 这适用于login到syslog的应用程序,但对写入本地文件的应用程序不太有用。 解决scheme可能包括让应用程序login到连接到程序的FIFO中,使用syslog发送消息,或者写一些grep本地文件并将输出发送到中央系统日志主机。 但是,如果我们去编写工具来把消息写入系统日志的麻烦,我们会更好地用像Scribe这样的东西来代替整个系统,它比syslog提供更多的灵活性和可靠性。 2)消息聚合 日志条目似乎分为两种types:每个主机和每个服务。 每主机消息是在一台机器上发生的消息; 认为磁盘失败或可疑的login。 运行服务的大多数或全部主机上都会出现每个服务的消息。 例如,我们想知道Apache何时发现一个SSI错误,但是我们不希望100台机器发生同样的错误。 在所有情况下,我们只希望看到每种消息types之一:我们不希望10条消息说同一个磁盘失败了,而且每次遇到一个破坏的SSI都不需要消息。 解决这个问题的一个方法是将多个相同types的消息聚合到每个主机上,将这些消息发送到中央服务器,然后将相同types的消息聚合成一个整体事件。 SER可以做到这一点,但使用起来很尴尬。 即使在几天的摆弄之后,我也只有基本的聚合工作,并且不得不经常查找SER用于关联事件的逻辑。 它function强大但棘手:我需要一些我的同事可以在最短的时间内拿起和使用的东西。 SER规则不符合要求。 3)生成警报 当有趣的事情发生时,我们如何告诉我们的pipe理员? 邮件收件箱? 注入Nagios? 那么,你是怎么解决这个问题的? 我不期望在盘子上有答案。 我可以自己搞清楚细节,但是一些高层次的讨论肯定是个普遍的问题。 目前我们正在使用cron作业,系统日志和谁知道还有什么可以find事件。 这不是可扩展的,可维护的或灵活的,因此我们错过了许多我们不应该做的事情。 更新:我们已经在使用Nagios进行监控,这对于检测到主机/testing服务/ etc是非常好的,但是对于抓取日志文件不太有用。 我知道有Nagios的日志插件,但是我对比每个主机警报更具可扩展性和层次感的东西感兴趣。

我如何被动地监视Windows事件日志?

如何远程监控Windows事件日志,以便在发生特定事件时自动通知我? 有很多主动的监控解决scheme,但需要人们的关注或不断的投票。 我需要一个被动的解决scheme,当一个特定的事件发生时,它只会产生一个通知