在基于Linux的数据中心中检测时间漂移的策略是什么?

在所有基于Linux的数据中心中检测时间漂移的策略是什么? 这是一个比起初看起来更难的问题。

时间漂移可能会对某些应用程序造成严重的问题,而且即使安装了NTP,也可能出现以下(以及更多)原因:

  • NTP未正确设置为在重新启动时自动重新启动。
  • 服务器上的设置不正确,因此指向的时间服务器无法访问或不准确。
  • 主时间服务器无法访问,所有服务器正与它同步,现在正在同步到一个不可靠的来源。

我想要一个方法来检测是否所有的个人服务器是正确的。 请记住,testing脚本/应用程序的服务器可能不正确。

这很容易控制。 configurationpipe理是关键

确保ntp服务正在运行和configuration…

例如,使用Monit确保ntpd正在运行,如果失败则重新启动它是一个简单的方法…将cron和其他必要的守护进程添加到这种检查可能是有意义的。

另一个select是使用像Puppet这样的configurationpipe理工具来强制ntpd.conf到你的服务器,并确保ntpd被安装,configuration和运行。

NTP协议中有足够的冗余来处理时间服务器不可达的情况。 指定多个来源。

那里有各种各样的check_ntp插件。

这里有一个:

http://nagiosplugins.org/man/check_ntp

添加此检查您的nagios主机,并得到警报,如果有任何错误。