10

我正在为即将到来的项目评估存储平台,并不断回到 Cassandra。对于这个项目,丢失任何数量的数据都是不可接受的。到目前为止,我们使用的是关系型数据库(Microsoft SQL Server),但数据种类繁多且庞大,以至于存储和查询成为问题。

Cassandra 是否足够强大,可以用作主数据存储?还是应该只用于镜像现有数据以加快访问速度?

4

2 回答 2

9

有趣的是:是的,Twitter、Digg、Ooyala、SimpleGeo、Mahalo 和其他人正在使用或迁移到 Cassandra 作为主要数据存储 ( http://n2.nabble.com/Cassandra-users-survey-td4040068.html )。

从技术上讲:是的;除了支持复制(包括到多个数据中心),每个 Cassandra 节点都有一个 fsync 的提交日志,以确保写入是持久的;从那里写入被转换为 SSTables,这些 SSTables 在压缩之前是不可变的(它将多个 SSTables 组合到 GC 旧版本)。随时支持快照,包括压缩前的自动快照。

于 2009-12-05T14:44:35.613 回答
4

是否将 Cassandra 用于您的应用程序完全取决于您的数据工作负载。Cassandra 针对写入密集型工作负载进行了优化,因此,它适用于需要插入大量数据的应用程序(例如 Facebook 的基础设施日志信息)。

但是,如果您需要快速检索并且插入速度不是问题,那么也许您应该看看 HBase(它针对读取密集型工作负载进行了优化)。

于 2011-09-20T16:19:59.403 回答