你如何validation服务器是否正常工作?

我想知道如何在configuration更改或补丁安装后validation服务器是否正常工作? 我发现很难检查例如在服务器上运行的所有应用程序是否不受所做更改的影响。

你知道任何“自动化”的方式来检查这种事情吗?

这是使用系统监视。 你有监视系统检查服务器上运行的所有站点和服务,然后如果你破坏了任何东西(或者它自己破坏),你就知道了。

那么在这之前你真正需要做的是确定你的评估工作是否正确。 你需要看看你的服务器,以及它在做什么,并说,这台服务器正常工作,它需要成功做XY和Z.

这可能是因为它需要为Web服务器正确提供网页,接收电子邮件并允许FTP访问。 如果是这种情况,那么是的,你可以自动化,你可以有一些监测服务或脚本来检查这些服务,或访问这些网页等。

你在找什么叫做监控软件 。 看看例如https://serverfault.com/questions/tagged/monitoring中的东西来得到一个想法。

大多数监控软件会做简单的检查(端口打开/网站加载/服务,如FTP / SMTP /响应)。 如果您需要更详尽的检查(检查某个网页是否包含某些文本等),您将不得不自己编写(因为这是应用程序特定的),但该软件将帮助您。

我可以亲自推荐ZenOSS,但有很多可用的。

取决于服务器的服务,真的。

对于大多数人来说,你可以做以下事情(离开我的头顶);

  1. 运行像Nagios这样的监视软件来查找没有运行的服务
  2. 在进行升级之前validation您是否拥有良好的系统备份; 备份应该允许从完整的服务器故障中恢复。
  3. testing服务器处理的服务(如果它是一个Web服务器,发送一个网页,发送一封电子邮件,以validation电子邮件的工作…)
  4. 检查系统重新启动后的日志以查看错误消息。

您无法完全testing它,或者完全知道系统是否正常工作,因为错误修复可能会造成在某些情况下无法正常工作的边缘情况。

你的意思是,你想要validation服务在更新后在服务器上备份吗? 在这种情况下,像Nagios这样的程序应该是完美的。 你的意思是testing服务器运行正常吗? 就我所知,这意味着要么编写自己的testing用例,要么手动testing,例如,你的Web服务器可能会出现,但是它会发出错误消息,因为Web服务器依赖于你的应用程序的数据库服务已经死了。

编辑:好的,NAGIOS可以在服务级别监控; 我的意思是这些服务可能是“在那里”,但是有些东西会以错误的方式受到影响,所以依靠自动化会给人一种错误的安全感。 我们已经遇到过我们的思科电话系统(Callmanager)似乎工作的很好,只有在很长的一段时间后才发现某些语音邮件没有正确的路由到邮件服务器; 我们不知道,直到调查用户说,他们被告知他们有语音邮件,他们从来没有得到…服务的自动监测不会没有专门检查日志,因为Callmanager的一切都说,它是function)。

如果您有特定需求或具体情况,您可能需要缩小范围并查看您遇到的情况。 我在硬件上看到类似的并行 我如何validation我升级的内存在我的电脑上工作? “启动并使用它。” 这并不意味着你不会看到奇怪的崩溃,因为内存不够适当,或者在特定的温度范围内出现微小的制造缺陷。

这是考虑虚拟化的另一个原因。 您可以最小化升级带来的影响,更容易从问题中恢复,并更轻松地将服务划分到单个服务器(Web服务器处理Web任务等),以及监视磁盘使用情况和networking使用情况,以便了解你的服务器更容易一点。 只是把它扔在那里,应该考虑一下机会:-)