我必须研究提供 MySQL 数据库的解决方案,该数据库可以处理 TB 范围内的数据量并具有高可用性(五个九)。每个数据库行可能有一个时间戳和最多 30 个浮点值。预期工作负载高达 2500 次插入/秒。查询可能不太频繁,但可能很大(可能涉及 100Gb 的数据),尽管可能只涉及单个表。
我一直在研究 MySQL Cluster,因为那是他们的 HA 产品。由于数据量大,我需要使用基于磁盘的存储。实际上,我认为只有时间戳可以保存在内存中,而所有其他数据都需要存储在磁盘上。
有没有人在这种规模的数据库上使用 MySQL Cluster 的经验?它甚至可行吗?基于磁盘的存储如何影响性能?
我也愿意接受其他关于如何实现这一数据量的预期可用性的建议。例如,使用像Sequoia这样的第三方库来处理标准 MySQL 实例的集群会更好吗?还是基于 MySQL 复制的更直接的解决方案?
唯一的条件是它必须是基于 MySQL 的解决方案。我不认为 MySQL 是处理我们正在处理的数据的最佳方式,但这是一个硬性要求。