我正在寻找一个工具来监视自定义PHP错误日志/ Apache和可能在远程开发服务器上的Java日志。 我不是在寻找一个完整的生产日志系统,比如Splunk,但是比sshterminal做一个“tail -f”更灵活一点。 也许有些事情会:*监视多个日志文件到我的本地机器,以便稍后search/分析*当某些string出现在日志中时,允许“警报”*提供某种被监视的多个日志的标签/仪表板视图比10个对数)。
我使用nagios进行监控,并使用nagiosgraph进行制图。 我想根据历史logging发出警报(例如,如果测量值自上次读取后发生变化)。 我已经读过,将历史信息存储在插件中是不明智的,可能是因为可能的调度问题。 那么实施这种测量的最佳方式是什么?
我有一个潜在的客户,有一个大多数时间performance良好的PHP网站。 但是,每个星期左右,它都会经历滞后(缓慢的页面加载)。 我相信有无数的事情可能导致这个(networking问题,糟糕的安装,一个特定的PHP文件,增加的stream量负载)。 但是,我需要一种方法来推断是什么导致了这一点。 是否有任何服务器监控软件是专门处理这些情况? PS:服务器是Linux
我发现了大量的工具来监视SHOW PROCESSLIST和SHOW INNODB STATUS的输出,但是还没有发现太多的东西,表明它会logging,摘要并总结(可选地启用)来自InnoDBlocking监视器的数据。 有这样的工具吗? (FWIW,我知道我可以启用slow_query_log并且已经这样做了,但是希望能够随着时间的推移logging更多特定的locking活动。遇到缓慢的查询时很难说的是其他线程/查询/用户造成的手动检查。)
在我们的企业中,我们有一个挑战,那就是我们至less有几个不同的员工信息存储位置。 我们正试图尽可能地巩固这一点,所以有一个地方可以去查看/编辑员工信息,例如姓名,地址和电话号码。 由于90%以上的员工拥有活跃的目录帐户,因此我们认为AD是制作主要信息源的好地方 – 从那里拉出/进行编辑。 其余的将从第二个人力资源系统更新/提取(人力资源系统是有限的,而不是用户友好的pipe理信息系统或其他非人力资源工作人员进出和定期编辑)。 这些员工是短期的,很可能不值得MIS不断的编辑。 因此,我正在寻找关于如何允许某些关键用户(例如,特定的经理或HR人员)访问某种实用程序或界面以编辑活动目录用户(或者甚至可能的话添加它们)的build议。 不过,我当然不想让任何非信息pipe理人员能够编辑组织成员的访问信息。 他们只能编辑个人信息,如姓名,地址,电话等。 我正在看的一个可能性是SpiceWorks – 我已经使用它,并与AD同步。 我知道它有能力将改变写回到AD,所以也许这将起作用。 任何人使用SpiceWorks或其他工具来做到这一点(或者有其他的build议)?
我需要监视我的Ubuntu Linux服务器的性能,在潜入nagios / zabbixtypes的“企业服务器监控”解决scheme之前,我宁愿更轻量级的东西。 我的要求很简单: 基本指标(内存,io,cpu,networking,磁盘空间和协同工作)开箱即用 有Web界面显示graphics 好的名单已深入: embeddedhttp服务器(如果它将是一个ruby/ python的解决scheme,这将是可怕的) 有实时更新页面 可以显示一个星期前/一个月前/定制范围发生了什么 支持软件组件的监视:打开的文件描述符的数量,jvm GC活动,在最近一小时(和公司)中打开的TCP会话 有统计数据 我查看了neural network,他们需要Apache运行networking前端。 – 编辑: 有效地,我会很高兴的东西,可以收集和graphicsrrd格式的sysstat或dstat,并使其可以作为一个网页
我试图设置Cacti来监视路由器的接口,而且我无法使graphics模板显示我想要的信息。 我们的界面configuration如下所示: interface GigabitEthernet3/6 description WalljackNumber # Server info no ip address no shutdown switchport switchport access vlan 116 switchport mode access ip dhcp snooping trust spanning-tree portfast “服务器信息”string实际上只是机器名称,并且是一个简短的相关说明,如“PolarSprings vmnic2”。 重要的部分似乎是它跟随哈希标记。 当我运行snmpwalk时,我得到正确的输出: IF-MIB::ifAlias.230 = STRING: WalljackNumber # Server info 但在Cacti中,当我进入graphics模板并将标题设置为: |host_description| – Traffic – |query_ifName| (|query_ifAlias|) 图中显示的是: switchname – Traffic – Gi3/6 (WalljackNumber #) 这让我觉得有点奇怪 […]
Monits内容检查有问题。 我知道我可以像这样检查日志文件 check file test.log with path logs/test.log if not match "something" for 5 cycles then alert 但是日志文件有很多variables,而且它的增长非常快,所以它在每一行都提醒我。 我遇到的问题是我需要忽略其他的一切。 我知道我可以在monit check内容中忽略variables,但这不会帮助我,因为每秒都会有数字发生变化。 我需要一种方法来检查这个日志文件,文件大小和时间戳不会帮助我,因为如果数据库丢失日志文件仍然在增长,因为它给我错误数据库已经消失。 现在我需要一种方法来监视它,所以我知道我的消息将发送给用户。 有没有人有这个好的解决scheme。 我真的需要它。
我想我知道答案(不可能) – 但是想看看有没有人有一个聪明的想法,或者我只是错了这个问题。 目标 如果出现以下情况,我们希望我们的class次经理得到服务中断的通知 该服务已经停止了一段时间。 即使问题得到了确认,通知也应该发送。 从Nagios文档: 对于通知: 当且仅当一个或多个升级定义匹配正在发送的当前通知时,通知才会升级。 致谢: 允许您确认指定服务的当前问题。 通过确认当前的问题, 将来的通知(针对相同的服务状态)将被禁用。 如果“sticky”选项设置为一(1),则确认将一直保留,直到服务返回OK状态。 否则,当服务改变状态时,确认将被自动删除。 如果“通知”选项设置为一(1),则会向联系人发送通知,表明当前的服务问题已被确认。 如果“persistent”选项设置为1,与确认关联的注释将在Nagios进程重新启动之后存活。 如果不是,下次Nagios重新启动时,注释将被删除。 我的理解是,如果问题得到了承认,那么就没有进一步的通知了 – 我认为这也适用于升级通知? 我没有看到这个方法。 我们的工作stream程需要L1团队承认这个问题,如果他们能够处理这个问题,并按需要升级。 但是,我们想要build立一个自动的过程来确保这些升级发生。 Nagios是我想要做的事情,但如果不可能,我们可能不得不在票务方面处理这个问题。 谢谢!
在一些教程中,我已经看到以下代码片段来监视PID过程: check process nodejs with pidfile "/var/run/yourprogram.pid" start program = "/sbin/start myapp" stop program = "/sbin/stop myapp" if failed port 8000 protocol HTTP request / with timeout 10 seconds then restart 但在其他一些情况下,我看到监视一个没有PID的整个主机,如下所示: check host localhost with address 127.0.0.1 start "/sbin/start myapp" stop "/sbin/stop myapp" if failed port 8000 protocol HTTP request / with timeout 10 […]