1

我希望这是一个合理的问题。

我有一个非常大的数据集(对我来说)。我有一个超过 800 万行的 639 mb 表。我将主要读取这些数据,并且数据应该基本上是持久的(它永远不会真正改变)。

在意识到我有超过 800 万行时,我开始怀疑我开始使用的 mySql 解决方案是否仍然是最佳的。这让我看到了 Nosql 和它的不同子集(cassandra、mongodb、postgresql)这些都是 nosql 的子集,对吧?

所以现在经过大量搜索谷歌指南并观看一些演示文稿并阅读一些简报后,我基本上只是想知道像 cassandra 和 mongodb 这样的东西是否本质上是相同的。如果sql的替代品基本上都是nosql。数据集何时变得如此之大以至于 nosql 解决方案变得比传统的 RDBMS 解决方案更优化?除了大型数据集之外,还有其他理由真的必须使用 nosql 替代品(除了出于性能原因)吗?通常我只是想知道哪些 sql 替代方案最适合大型数据集和可扩展性,大型数据集的资格是什么,以及处理这些大型数据集的领先行业标准是什么?

我对 DBA 和 Web 开发人员可能对此有什么看法非常感兴趣。非常感谢您提供任何有用的信息,我真的很感激(即使您只是将我指向资源)。

编辑:这个问题被搁置是因为“许多好的问题会根据专家的经验产生一定程度的意见,但这个问题的答案往往几乎完全基于意见,而不是事实、参考资料或特定的专业知识。” 我明白这是从哪里来的。不过,我希望能对行业标准有所了解。就像人们可能会不同意并挑剔在这个特定实例中使用哪种类型的数据库,但肯定有众所周知的标准,如果符合这些标准,将有资格使用 mysql 或 nosql。同样可能有一些子标准可以使用 cassandra 或 mongodb。我希望在该领域有多年经验的人可以插话或指出我可以用来更好地区分这些资源的资源。我理解这是否不可能,但我希望它是。干杯,斯蒂芬。

4

1 回答 1

1

800 万行和 639 mb 表对于大多数 RDBMS 来说并不是什么特别的东西。它可能需要一些调整或索引,但并不难。

您应该根据相关表的结构选择数据库。如果它是一个“真实”表(其中的数据可以用表格式表示)——那么任何 RDBMS 都应该适合这种情况。

于 2013-07-08T13:02:17.703 回答