以Cassandra备份

我们目前有12个节点在我们的Cassandra集群中运行。 最终,即使有几个节点出现故障,我们仍然在运行。 我的偏执狂想每天至less做一次备份并将其存储在Amazon S3上。 我的问题如下:

备份Cassandra时,从一个节点运行备份就足够了,还是必须从12个节点中的每一个运行备份脚本,并将其各自的备份推送到S3? 如果在某一时刻需要恢复,我们是否需要从单个节点进行备份备份,还是有办法将备份“聚合”(假设您需要从每个节点单独获取)到一个大的恢复过程中?

有点文件混淆。 只是想在我的Cassandra集群上获得有效的备份stream程。

您需要备份每个节点,除非每个节点存储100%的数据,那么您只能备份一个节点。

备份Cassandra最简单的方法是备份每个节点。 我之前使用过tablesnap来自动完成这个工作,这非常好。 Netflix也有Priam,但我没有亲自尝试过。 https://github.com/Netflix/Priam