cassandra - Cassandra 数据库上数据分析的替代方案

Question

我们需要对 Cassandra 数据库执行分析和报告。

以下是我们迄今为止确定的方法。

1）在 cassandra 上使用 spark 。

缺点：

2）将数据移至红移并在其上执行分析。

缺点：

我们需要将数据从 cassandra 移动到 redshift。我们已经确定 AWS Firehose 可以为我们执行此操作。除了写入 cassandra，我们还将写入 firehose 流，该流将为我们写入 redshift。
AWS 成本涉及 redshift 和 Firehose 。

到目前为止，我们倾向于 redshift 。我上面的假设有什么错误吗？有没有其他选择？

score 1 · Accepted Answer

带有 Cassandra 的 Spark 可能是更常见的选择。有两点值得注意，a) 您可以使用 Spark 在内存中缓存 RDD；2) Spark SQL 工作正常，您不需要使用 Spark 编程语言。

1 回答 1