在单个Linux服务器上,通常有许多独立的(可能是相互关联的)服务,以众所周知的path将许多日志输出到文件中。 有时坏的东西发生,并写入日志。 有时服务会被锁住,而日志不会(或者很less)有新的条目。 使用一个工具/服务/系统来监视这两种事件的最简单的方法是什么?
我试图设置监视在我的Windows服务器上存在的几个MSSQL实例。 这里的问题是,如果服务名称包含$ (例如, MSSQL$PROD ),那么check_nt命令将返回一个空警告。 以下是我在windows.cfg一个例子 define service{ use generic-service host_name SERVERNAME service_description MSSQL Service check_command check_nt!SERVICESTATE!-d SHOWALL -l MSSQL$PROD } 我已经尝试围绕服务名称与“”(与空间服务工作),并在服务名称中的$前面加一个反斜杠没有运气。 有谁知道这是否可以做到?
有没有免费的票务系统/事件pipe理系统,可以帮助我实现以下目标? 1)如果一个服务出现故障,那么Nagios会警告值class人员,并把状态推到一些后台或数据库作为一张票,比如初始状态是"New" 。 2)值class人员通过前台login并通过将其标记为"In progress ”来确认新的票证,所以现在票证的状态从"New"改变为"In progress" 。 3)即使在“n”分钟之后,没有值class人员将票状态更改为"In progress" Nagios会提醒下一级联系人。 虽然值class人员已经确认了机票,但是没有必要提醒下一个级别。 4)服务启动时,Nagios通过标记“ Closed" 现在我已经设置了Nagios监控,目前它通过发送短信和邮件来发出警报,但是我正在寻找的是一些只会升级问题(警告第二级)的框架,如果第一级(值class人员)失败以响应最初的警报。 通过“响应警报”,我的意思是,值class人员可以通过一些前端login,基本上将状态更改为"Acknowledged"或"In progress" 。
我如何不断地监视(小)文件的变化? 例如。 当文件被更新时(来自web应用程序的动作),脚本被执行(如果尚未运行的话)。 现在,我用cron每分钟做一次,但是这个延迟了一分钟。 我想在文件更改后立即采取行动。 也许我需要在服务器启动后编写一些在后台运行的低级进程? 我想这样做的原因是将Web应用程序与根操作分开(按需执行,一次更新文件时)。
我有多个系列的stats.counters.app.view.isbn.fetch.found.{yes,no}.$service 。 我想计算每个$service的失败率。 #A reduceSeries(mapSeries(group(#B, #C), 0), 'asPercent', 1, 'none', 'total') #B aliasSub(groupByNode(stats.counters.app.view.isbn.fetch.found.*.*.rate, 8, "sumSeries"), "^(.*)$", "\1.total") #C aliasSub(groupByNode(stats.counters.app.view.isbn.fetch.found.no.*.rate, 8, "sumSeries"), "^(.*)$", "\1.none") 但是,这会导致错误。 从我尝试过的所有可能的变体中,这一个感觉是最正确的,但它仍然失败。
有没有办法在htop中拍摄I / O等待百分比? 我找不到如何启用此function。 在下面的链接有一个我需要的function的例子(“平均:”行): http : //www.concept47.com/austin_web_developer_blog/sysadmin/something-cool-i-learned-about-htop/但在我的版本的htop 2.0.2我不知道如何启用这个。 我知道我可以从iotop和类似的工具获得这个信息,但是我希望在htop中有这个信息。
什么是最好的方式来获取有关PHP错误的报告? 为了给出一些背景知识,可以使用一些遗留的PHP应用程序/网站来生成各种错误/警告等,目前正在进入apache日志。 希望能够以graphics方式在开发人员所在办公室的屏幕上显示。 希望通过提高这些错误的可见性,首先会使人们迅速意识到升级是否会增加错误率,并有助于长期追求将错误降低到零。 对于额外的点,能够将错误分成导致错误的文件path的一部分(即:通过站点分割错误)将是很好的。 最好的工具是什么? 我正在看仙人掌,之前曾经使用过zenoss进行其他监控。 但是无法find关于如何做到这一点的信息 – 希望其他人已经做到了!
有一个应用程序或技术,我可以使用自我监视服务器? 对于一种技术,我正在考虑每分钟写一个日志文件,每隔一小时清理一次,每分钟记下我的应用程序没有写入(在另一个文件或数据库中) 对于DB我想我可以写一个随机值,然后每分钟读一遍。 最后使用curl,lib或其他东西在我的页面上做GET请求。 也许这永远不会失败? 我应该使用代理服务器对自己做一个GET请求? 我打算使用Windows服务器。 我也可能有一个Linux服务器。 我想crontab可以启动我的应用程序每分钟(自我quiting如果一个实例已经存在),我不确定在Windows上使用什么。
我有一个运行大量cronjob的系统。 看来这些cron中的一个正在消耗过多的CPU和内存。 有没有简单的方法来审计cron作业的CPU和内存使用情况?
我们有一台运行Tru64 Unix的服务器,这是我们公司使用的单一应用程序的主要生产服务器。 软件供应商完全控制硬件和软件(我们仍在pipe理软件,但没有root权限)。 然而供应商已经允许我们运行vmstat,这将产生输出每15秒10个间隔然后退出。 我要build立一个自动化的进程,运行vmstat,logging输出。 我认为这将是相当有用的信息,特别是考虑到我们最近有性能问题。 Mangement告诉我,我不能这样做,因为vmstat咀嚼了很多资源,并且如果它不断运行,系统将会下降。 谁能告诉我这是真的吗?