我有大约二十个不同的webapps的服务器。 每4小时运行rsnapshot任务并将其全部备份到备份服务器。
今天偶然发现由于文件系统input/输出失败,最近4天备份失败。 fsck解决了这个问题,但是4个备份日失去了。
有没有办法检查备份是否正常?
现在我使用munin监控系统,如果它确实很重要,虽然它只检查服务器的健康状况(内存,cpu,硬盘等),没有任何软件检查。 我可以集成一个脚本来检查在rsnapshot日志中的FATAL ERROR条目,但是我不确定它是否足够了?
可能是从备份引导环境的系统来检查其完整性。 不幸的是我没有find足够的信息。
确保您还在监视文件系统可用空间,监视关键/严重邮件的系统日志,磁盘的SMART输出,networking和备份服务(ssh / rsync)。
关于validation您的备份,您可能需要并行设置您的webapps环境,并定期恢复您的备份。 您的备份与恢复一样好。