在我的 lambda 架构中,我正在讨论是使用 HDFS 还是 Cassandra 来存储我的不可变数据。我需要 Cassandra 来处理在线请求等,所以它是技术堆栈的强制性部分。现在,如果没有必要,我不想将新工具 (HDFS) 引入堆栈。所以我的问题是,如果我不使用 HDFS 并使用 Cassandra 来托管我的不可变数据,我会缺少什么。
编辑:
我了解 HDFS 是分布式文件系统,而 Cassandra 是 NoSQL DB。尽管如此,两者都支持数据复制,都支持高吞吐量写入。此外,Cassandra 支持低潜在数据检索。那么我是否正确地说 HDFS 不会为我提供太多提升?