减less因电力损失而导致数据损坏的风险

我们目前有一些服务器因为各种原因经常掉电的地方。 这些服务器都与一些Linux客户端一起运行ESX。 把UPS放在这里是不实际的,所以我正在寻找一些方法来降低我们损坏文件系统的风险。

我原来看RAID控制器(不是专门为磁盘冗余),但我读过使用caching等function实际上可能会增加数据丢失的风险。 这似乎也控制器caching电池可能会帮助,但我不完全相信。

有谁知道RAID控制卡实际上是否提供这种保护,或者有什么我们可以做的一般来降低我们的风险?

对于SSD来说,存储控制器可以带有电池支持的写入caching和/或超级电容(icitor)来保护停电期间的caching写入。
实际上,当那些仍然不能保护数据完整性的情况下,虽然BBWC将提供比使用没有电池的写入caching更好的保护,但完全禁用任何和所有写入caching(以一些性能为代价)可以更可靠。

但推荐的工具仍然是一个UPS,因为即使是一个小的系统,也可以让系统在停电时正常关机,电池即将耗尽(同时保护硬件免受重复的电力冲击)。

带有BBU的 RAID控制器有时可以降低发生不正常关机时文件系统错误的风险。 有时候,因为你不能保证你的文件系统上的操作系统在你的磁盘上写入一些数据块时不会被中止,所以操作系统将变得不可用(不一定是文件系统)。 与此同时,我会投资一些(非常小的)UPS,这样服务器就可以在发生停电时正常关机。

编辑:好吧,@HBruijn打我:)

有一个单一的主机与启用了回写caching​​的单个RAID,有一天肯定会是一个数据损坏问题。

看看软件定义的存储解决scheme,该解决scheme提供了> 2次的容错失败(存储数据的2份以上)。 拥有一个节点集群,每个节点都连接到UPS和在RAID 10/6之上提供的共享存储,可能会将数据损坏降低到无。 显然,2个独立的电力线应连接到UPS。 有这样的设置可以确保启用/使用caching。