在接下来的2-3年里,我们将扩大项目的数据收集。 结果,数据量将增长10倍。 我们目前的MySQL安装可以跟上2TB的数据,但是对于较大的查询,有相当数量的IOWait。
我正在调查向集群解决scheme的迁移,以分散IO,但是我想知道NDB,以及不经常访问的数据会发生什么情况。 我从阅读MySQL集群的印象是,它依赖大部分数据的内存表。 那些没有经常访问(或根本不访问)的表会发生什么? 而且备份如何工作? 我可以使用MYSQLDUMP还是有更好的解决scheme?
NDB由于其内存模型而对大型表格有一些限制。 对于你的情况,是没有意义的。
最近,我们testing了一些非常有希望的结果的Percona集群。 它支持主 – 主复制,并具有完整的InnoDB ACID合规性。 有一点需要注意的是,查询的速度仅限于集群中最慢的节点 – 许多主/从的MySQL安装通常拥有更快的主节点。
如果你需要真正的快速访问,你也可以将真正的大数据集转换成MongoDB或Cassandra。 这些都比像MySQL这样的RDBMS快得多。 这些NoSQL数据库中的集群是本地的。