我最近在服务器端备份软件和策略上读了很多。
我很想知道什么策略和软件的经验丰富的系统pipe理员(这里在ServerFault)使用。
也请张贴你使用这个策略的环境(Windows,Linux等)
希望能够从这篇文章中学到很多东西,并且在我确定自己的备份策略的那一刻,尽可能地贡献自己的力量。 ;)
“备份和恢复”O'Reilly的书。 强烈推荐。
我对我和我的球队有几条规定。 希望他们中的一些人对你有用。
最后,主要是:
我们用什么:
对于服务器 – 我们拥有VMWare VSphere上的所有内容,并且对DataRecovery几乎感到满意。 对于Oracle和其他数据库,我们使用他们的内部工具。 对于工作站 – 我们终于将所有东西都迁移到了iSCSI或瘦客户端,所以没有更慢的Acronis和其他狗屎。
我们有一个混合的环境(70%的Linux和30%的Windows)。 对于(主要)遗留的原因,我们在Windows端使用EMC Networker(使用磁带更换器),在Linux端使用bacula。 所有的Linux服务器都通过bacula进行覆盖,然后在该服务器上生成的备份目录将包含在EMC备份中(我们的夜间备份大小约为3TB)。
基本策略是对于所有的机器,我们只覆盖那些不能通过标准来源获得的部分。 换句话说:数据文件,数据库,configuration文件等等。 在某些情况下,备份过程没有本地客户端,并且使用NFS挂载来访问需要备份的东西(因为除了NFS挂载之外,这些目标服务器总是在变化,而且更容易提供NFS挂载点)。
如果服务器完全离开(从来没有这种情况),我们会购买replace硬件,安装操作系统和所有软件包,恢复configuration文件和数据,并离开你去。 如上所说,我们从来没有这样的情况下,服务器完全doolally挖掘。 我们的备份主要用于意外删除文件或文件损坏的用户。 我们曾经有过这样的情况,一些构build服务器必须从头开始恢复,因为有些工程师把它们置于不可能正常恢复的状态,原理工作得很好(除了恢复30GB数据只需要一些时间) 。 我可能应该补充说,我们所有的关键任务服务器都运行在RAIDarrays和冗余电源上,而且我们通常也保留一些相当多的备用硬件。
我们的备份解决scheme可能不是最好的做法,但它工作得很好。 环境混合Windows(80%)和Linux(20%)。 我们曾经为我们的数据库服务器和源代码控制仓库使用磁带备份,但是最近却放弃了这个想法(这是我的头脑决定的!)
我们在Windows服务器上使用StorageCraft ShadowProtect Server版本,并根据服务的重要性采用不同的策略(例如Exchange每半小时备份一次)。 它创build了系统的基本映像,对性能的影响最小(尽pipe在重负载的数据库服务器上,我们看到了一些问题 – 主要是由于磁盘I / O超出最终导致机器停机)。 它运行得非常好,并给了我们硬件独立恢复的选项,这意味着我们不必过于担心我们用哪个供应商replace硬件(我们有来自IBM,惠普,戴尔和使用泰安准系统的自定义版本的服务器)。
Linux服务器是另一回事,我们主要使用由高级系统工程师编写的自定义脚本。 基本原理是备份重要数据,而不用担心操作系统太多。
我们的文件服务器和邮件服务器提供了40TB的HP EVA StorageWorks SAN,提供了额外的保护。 我们的备份服务器是使用RAID 5定制24TB存储的。我们使用SyncBack Pro对项目文件共享和任何其他需要的文件级备份进行夜间备份。 一旦在主备份服务器上,数据被SCP传送到离线服务器。
我们也确保我们有大部分硬件的支持合同。 台式机24小时修复,戴尔和惠普服务器8小时,让生活变得更简单。
我尝试应用于备份的原则:
至于软件方面,我发现rdiff-backup是一个很好的解决scheme,可以让我获得最近30天的备份。 我每晚都运行一个简单的包装脚本 ,将所有的Linux服务器备份到备份服务器上,备份服务器位于encryption的LVM分区上。 BackupNinja在所有服务器上运行,并在夜间备份运行之前负责转储数据库等。
备份一下。 有三个“原因”来备份您的数据。
1)灾难恢复
这可以保护您免受“meteor袭击您的build筑”的情况。 您需要一些快速重build整个服务器的方法。 这个问题的经典答案是完整的系统备份。 问题是在一段时间之后,大部分数据对DR(操作系统数据,大量静态的应用程序数据等)几乎毫无价值。
2)用户错误。
这种types的备份覆盖了'呃,我把这个文件丢了2个月以前,这个文件真的很重要',或者'呃,我们的DBA放弃了这张表,但忘记了这个月度报告我们最后需要运行一次'等等。保留这些备份多长时间是一个商业决策。 我听说从1个月到2年的一切。
3)档案。
这是政府机构经常要求的真正的长期备份……“国税局要求这类财务logging为7或14年”。 好消息是,这通常是您的数据的一小部分。 磁带对此很有好处,或者经常光学媒体。
有了这些数据类(以及对您的环境的良好审计),您可以开始分类实际需要的数据types。
这是我们的备份策略(注意:这有点复杂)。 一般策略:备份到磁盘,将一些数据复制到磁带。 我们每月运行一次完整备份,每周进行一次备份,每天进行一次备份。 我们在磁盘上保留完整备份3个月,在磁带上保留1年。 我们保持L2备份4周,L3备份保持2周。 这为我们提供了过去两周的高分辨率备份,而且分辨率越来越低,这是您需要的时间。 在我们的用户份额(netapp)上,我们不做L3备份,而是依靠快照。 这使恢复更容易pipe理。
我们获得的巨大胜利是我们有3个“网站”。 其中一个是主站点,而我们的备份环境(磁盘,媒体服务器,磁带机器人等)则位于其中一个辅助站点。 这是我们对“数据中心消失”types问题的重大保护。