监视服务器 Gind.cn

用于“ssh tail -f”风格日志文件监控和分析的最佳工具

我正在寻找一个工具来监视自定义PHP错误日志/ Apache和可能在远程开发服务器上的Java日志。我不是在寻找一个完整的生产日志系统，比如Splunk，但是比sshterminal做一个“tail -f”更灵活一点。也许有些事情会：*监视多个日志文件到我的本地机器，以便稍后search/分析*当某些string出现在日志中时，允许“警报”*提供某种被监视的多个日志的标签/仪表板视图比10个对数）。

基于之前的测量值的nagios警报

我使用nagios进行监控，并使用nagiosgraph进行制图。我想根据历史logging发出警报（例如，如果测量值自上次读取后发生变化）。我已经读过，将历史信息存储在插件中是不明智的，可能是因为可能的调度问题。那么实施这种测量的最佳方式是什么？

找出导致服务器减速的原因

我有一个潜在的客户，有一个大多数时间performance良好的PHP网站。但是，每个星期左右，它都会经历滞后（缓慢的页面加载）。我相信有无数的事情可能导致这个（networking问题，糟糕的安装，一个特定的PHP文件，增加的stream量负载）。但是，我需要一种方法来推断是什么导致了这一点。是否有任何服务器监控软件是专门处理这些情况？ PS：服务器是Linux

监测Innodb Lock监测输出？

我发现了大量的工具来监视SHOW PROCESSLIST和SHOW INNODB STATUS的输出，但是还没有发现太多的东西，表明它会logging，摘要并总结（可选地启用）来自InnoDBlocking监视器的数据。有这样的工具吗？（FWIW，我知道我可以启用slow_query_log并且已经这样做了，但是希望能够随着时间的推移logging更多特定的locking活动。遇到缓慢的查询时很难说的是其他线程/查询/用户造成的手动检查。）

使用活动目录作为主人员数据库并允许特定用户编辑function

在我们的企业中，我们有一个挑战，那就是我们至less有几个不同的员工信息存储位置。我们正试图尽可能地巩固这一点，所以有一个地方可以去查看/编辑员工信息，例如姓名，地址和电话号码。由于90％以上的员工拥有活跃的目录帐户，因此我们认为AD是制作主要信息源的好地方 – 从那里拉出/进行编辑。其余的将从第二个人力资源系统更新/提取（人力资源系统是有限的，而不是用户友好的pipe理信息系统或其他非人力资源工作人员进出和定期编辑）。这些员工是短期的，很可能不值得MIS不断的编辑。因此，我正在寻找关于如何允许某些关键用户（例如，特定的经理或HR人员）访问某种实用程序或界面以编辑活动目录用户（或者甚至可能的话添加它们）的build议。不过，我当然不想让任何非信息pipe理人员能够编辑组织成员的访问信息。他们只能编辑个人信息，如姓名，地址，电话等。我正在看的一个可能性是SpiceWorks – 我已经使用它，并与AD同步。我知道它有能力将改变写回到AD，所以也许这将起作用。任何人使用SpiceWorks或其他工具来做到这一点（或者有其他的build议）？

轻量级（即插即用）机器资源监控工具？

我需要监视我的Ubuntu Linux服务器的性能，在潜入nagios / zabbixtypes的“企业服务器监控”解决scheme之前，我宁愿更轻量级的东西。我的要求很简单：基本指标（内存，io，cpu，networking，磁盘空间和协同工作）开箱即用有Web界面显示graphics 好的名单已深入： embeddedhttp服务器（如果它将是一个ruby/ python的解决scheme，这将是可怕的）有实时更新页面可以显示一个星期前/一个月前/定制范围发生了什么支持软件组件的监视：打开的文件描述符的数量，jvm GC活动，在最近一小时（和公司）中打开的TCP会话有统计数据我查看了neural network，他们需要Apache运行networking前端。 – 编辑：有效地，我会很高兴的东西，可以收集和graphicsrrd格式的sysstat或dstat，并使其可以作为一个网页

仙人掌忽略接口别名中的散列标记

我试图设置Cacti来监视路由器的接口，而且我无法使graphics模板显示我想要的信息。我们的界面configuration如下所示： interface GigabitEthernet3/6 description WalljackNumber # Server info no ip address no shutdown switchport switchport access vlan 116 switchport mode access ip dhcp snooping trust spanning-tree portfast “服务器信息”string实际上只是机器名称，并且是一个简短的相关说明，如“PolarSprings vmnic2”。重要的部分似乎是它跟随哈希标记。当我运行snmpwalk时，我得到正确的输出： IF-MIB::ifAlias.230 = STRING: WalljackNumber # Server info 但在Cacti中，当我进入graphics模板并将标题设置为： |host_description| – Traffic – |query_ifName| (|query_ifAlias|) 图中显示的是： switchname – Traffic – Gi3/6 (WalljackNumber #) 这让我觉得有点奇怪 […]

Monit检查日志文件的内容

Monits内容检查有问题。我知道我可以像这样检查日志文件 check file test.log with path logs/test.log if not match "something" for 5 cycles then alert 但是日志文件有很多variables，而且它的增长非常快，所以它在每一行都提醒我。我遇到的问题是我需要忽略其他的一切。我知道我可以在monit check内容中忽略variables，但这不会帮助我，因为每秒都会有数字发生变化。我需要一种方法来检查这个日志文件，文件大小和时间戳不会帮助我，因为如果数据库丢失日志文件仍然在增长，因为它给我错误数据库已经消失。现在我需要一种方法来监视它，所以我知道我的消息将发送给用户。有没有人有这个好的解决scheme。我真的需要它。

Nagios：如果问题已确认但未恢复，请发送升级警报（OK状态）

我想我知道答案（不可能） – 但是想看看有没有人有一个聪明的想法，或者我只是错了这个问题。目标如果出现以下情况，我们希望我们的class次经理得到服务中断的通知该服务已经停止了一段时间。即使问题得到了确认，通知也应该发送。从Nagios文档：对于通知：当且仅当一个或多个升级定义匹配正在发送的当前通知时，通知才会升级。致谢：允许您确认指定服务的当前问题。通过确认当前的问题，将来的通知（针对相同的服务状态）将被禁用。如果“sticky”选项设置为一（1），则确认将一直保留，直到服务返回OK状态。否则，当服务改变状态时，确认将被自动删除。如果“通知”选项设置为一（1），则会向联系人发送通知，表明当前的服务问题已被确认。如果“persistent”选项设置为1，与确认关联的注释将在Nagios进程重新启动之后存活。如果不是，下次Nagios重新启动时，注释将被删除。我的理解是，如果问题得到了承认，那么就没有进一步的通知了 – 我认为这也适用于升级通知？我没有看到这个方法。我们的工作stream程需要L1团队承认这个问题，如果他们能够处理这个问题，并按需要升级。但是，我们想要build立一个自动的过程来确保这些升级发生。 Nagios是我想要做的事情，但如果不可能，我们可能不得不在票务方面处理这个问题。谢谢！

是否有必要监视proccesses的PID？

在一些教程中，我已经看到以下代码片段来监视PID过程： check process nodejs with pidfile "/var/run/yourprogram.pid" start program = "/sbin/start myapp" stop program = "/sbin/stop myapp" if failed port 8000 protocol HTTP request / with timeout 10 seconds then restart 但在其他一些情况下，我看到监视一个没有PID的整个主机，如下所示： check host localhost with address 127.0.0.1 start "/sbin/start myapp" stop "/sbin/stop myapp" if failed port 8000 protocol HTTP request / with timeout 10 […]

Intereting Posts

禁止自己从我自己的服务器，或与我的DNS？将多个服务器的stream量路由到另一个 VMWare Esxi寻找瓶颈如何保持SharePoint开发机器的快速和响应？更改iSCSI块存储备份解决scheme，CBT是否需要重置？ terminal连接从主IP以外的其他本地IP 下载暂停，并经常超时如何编写多个mod重写规则？ NGINX在写作状态下积累连接是否正常？ Linux查找工具看不到ffs的nfs分区 VMWare主机未响应 – 虚拟机断开连接（ESXi 3.5）有效同步100万个文件与远程服务器的选项？独立工具来同步Windows中的两个文件夹？具有多个IP地址的服务器？错误2003（HY000）：无法连接到服务器“myhost.com”上的MySQL（101）

Articles of 监视