监视服务器 Gind.cn

监视（a）string/正则expression式匹配和（b）缺less输出的日志文件最简单的方法是什么？

在单个Linux服务器上，通常有许多独立的（可能是相互关联的）服务，以众所周知的path将许多日志输出到文件中。有时坏的东西发生，并写入日志。有时服务会被锁住，而日志不会（或者很less）有新的条目。使用一个工具/服务/系统来监视这两种事件的最简单的方法是什么？

在Icinga / Nagios服务名称中使用$监视服务

我试图设置监视在我的Windows服务器上存在的几个MSSQL实例。这里的问题是，如果服务名称包含$ （例如， MSSQL$PROD ），那么check_nt命令将返回一个空警告。以下是我在windows.cfg一个例子 define service{ use generic-service host_name SERVERNAME service_description MSSQL Service check_command check_nt!SERVICESTATE!-d SHOWALL -l MSSQL$PROD } 我已经尝试围绕服务名称与“”（与空间服务工作），并在服务名称中的$前面加一个反斜杠没有运气。有谁知道这是否可以做到？

将Nagios与票务/事件pipe理系统集成

有没有免费的票务系统/事件pipe理系统，可以帮助我实现以下目标？ 1）如果一个服务出现故障，那么Nagios会警告值class人员，并把状态推到一些后台或数据库作为一张票，比如初始状态是"New" 。 2）值class人员通过前台login并通过将其标记为"In progress ”来确认新的票证，所以现在票证的状态从"New"改变为"In progress" 。 3）即使在“n”分钟之后，没有值class人员将票状态更改为"In progress" Nagios会提醒下一级联系人。虽然值class人员已经确认了机票，但是没有必要提醒下一个级别。 4）服务启动时，Nagios通过标记“ Closed" 现在我已经设置了Nagios监控，目前它通过发送短信和邮件来发出警报，但是我正在寻找的是一些只会升级问题（警告第二级）的框架，如果第一级（值class人员）失败以响应最初的警报。通过“响应警报”，我的意思是，值class人员可以通过一些前端login，基本上将状态更改为"Acknowledged"或"In progress" 。

监控文件的变化，并立即采取行动的变化

我如何不断地监视（小）文件的变化？例如。当文件被更新时（来自web应用程序的动作），脚本被执行（如果尚未运行的话）。现在，我用cron每分钟做一次，但是这个延迟了一分钟。我想在文件更改后立即采取行动。也许我需要在服务器启动后编写一些在后台运行的低级进程？我想这样做的原因是将Web应用程序与根操作分开（按需执行，一次更新文件时）。

Graphite中带有asPercent的多个通配符

我有多个系列的stats.counters.app.view.isbn.fetch.found.{yes,no}.$service 。我想计算每个$service的失败率。 #A reduceSeries(mapSeries(group(#B, #C), 0), 'asPercent', 1, 'none', 'total') #B aliasSub(groupByNode(stats.counters.app.view.isbn.fetch.found.*.*.rate, 8, "sumSeries"), "^(.*)$", "\1.total") #C aliasSub(groupByNode(stats.counters.app.view.isbn.fetch.found.no.*.rate, 8, "sumSeries"), "^(.*)$", "\1.none") 但是，这会导致错误。从我尝试过的所有可能的变体中，这一个感觉是最正确的，但它仍然失败。

htop – 显示I / O等待百分比

有没有办法在htop中拍摄I / O等待百分比？我找不到如何启用此function。在下面的链接有一个我需要的function的例子（“平均：”行）： http : //www.concept47.com/austin_web_developer_blog/sysadmin/something-cool-i-learned-about-htop/但在我的版本的htop 2.0.2我不知道如何启用这个。我知道我可以从iotop和类似的工具获得这个信息，但是我希望在htop中有这个信息。

图表/报告PHP错误

什么是最好的方式来获取有关PHP错误的报告？为了给出一些背景知识，可以使用一些遗留的PHP应用程序/网站来生成各种错误/警告等，目前正在进入apache日志。希望能够以graphics方式在开发人员所在办公室的屏幕上显示。希望通过提高这些错误的可见性，首先会使人们迅速意识到升级是否会增加错误率，并有助于长期追求将错误降低到零。对于额外的点，能够将错误分成导致错误的文件path的一部分（即：通过站点分割错误）将是很好的。最好的工具是什么？我正在看仙人掌，之前曾经使用过zenoss进行其他监控。但是无法find关于如何做到这一点的信息 – 希望其他人已经做到了！

自动运行时间监视器？

有一个应用程序或技术，我可以使用自我监视服务器？对于一种技术，我正在考虑每分钟写一个日志文件，每隔一小时清理一次，每分钟记下我的应用程序没有写入（在另一个文件或数据库中）对于DB我想我可以写一个随机值，然后每分钟读一遍。最后使用curl，lib或其他东西在我的页面上做GET请求。也许这永远不会失败？我应该使用代理服务器对自己做一个GET请求？我打算使用Windows服务器。我也可能有一个Linux服务器。我想crontab可以启动我的应用程序每分钟（自我quiting如果一个实例已经存在），我不确定在Windows上使用什么。

审计cron作业的CPU和内存使用情况

我有一个运行大量cronjob的系统。看来这些cron中的一个正在消耗过多的CPU和内存。有没有简单的方法来审计cron作业的CPU和内存使用情况？

vmstat真的使用多less资源？

我们有一台运行Tru64 Unix的服务器，这是我们公司使用的单一应用程序的主要生产服务器。软件供应商完全控制硬件和软件（我们仍在pipe理软件，但没有root权限）。然而供应商已经允许我们运行vmstat，这将产生输出每15秒10个间隔然后退出。我要build立一个自动化的进程，运行vmstat，logging输出。我认为这将是相当有用的信息，特别是考虑到我们最近有性能问题。 Mangement告诉我，我不能这样做，因为vmstat咀嚼了很多资源，并且如果它不断运行，系统将会下降。谁能告诉我这是真的吗？

Intereting Posts

WordPress永久链接设置页面无法更新.htaccess 缺lessraddb文件夹为什么ASP.NET不在性能监视器中？哪种压缩文件格式对rsync有效？ HTB.init / tc在NAT之后将WMI-Command发送到Hyper-V虚拟机 .htaccess httpsredirect最佳方法 Upstart（init）脚本的“最佳”启动值是什么？用户减lessLVM逻辑卷，而不调整文件系统的大小我怎样才能使error_log无法访问networking？符号链接到根目录中的文件夹磁盘映像压缩下降我如何pipe理数百个IPMI BMC？ 3个硬盘驱动器失败，2个机箱和2个 Apache不听指定的端口

Articles of 监视