Cassandra 是否适合这种情况?
- 只有一个表(键/值)。
- 超多行,例如 10 万亿行。
- 拥有 1000 台服务器的集群
- 50%:50% 范围/列表和键获取。(范围/列表的TPS会随着它的增长而增加)
我知道 Cassandra 可以很好地扩展用于繁重的写入和读取查询,因为密钥是由哈希环自然分布的。而且我也知道在分区上会付出最少的努力。
但从他们的白皮书中,我的见解是它只会扩大直接匹配键的查询。并且并没有真正扩大范围/列表查询,因为键索引将像任何其他键一样存储在几个服务器中。而且,单个范围查询也有可能会访问集群中的每台服务器以获取密钥。如果是这种情况,随着我添加更多服务器,范围查询会变慢。
我想知道我的理解是否正确,还想知道范围查询是否随着我添加更多服务器而与键一起线性扩展。
我试图找出我在未来像谷歌规模一样成长时所面临的真正挑战。