1

我有一个 cassandra 集群部署了 3 个 cassandra 节点,复制因子为 3。我每天都有大量数据写入 cassandra(10-15GB)。我已经按照“大数据社区”的建议在商品硬件上配置了这些 cassandra,我希望节点经常停机,这是使用 cassandra 提供的冗余来处理的。

我的问题是,我观察到 cassandra 在配置新节点并且在引导时正在流式传输数据时会减慢写入速度。因此,为了克服这个障碍,我们决定有一个单独的网络接口用于节点间通信和客户端应用程序将数据写入 cassandra。我的问题是如何配置它,如果这一切可能的话?

任何帮助表示赞赏。

4

1 回答 1

1

我认为您正在寻找错误的解决方案。

我对您只有 3 个节点这一事实感到困惑,但您担心的是引导时写入速度慢。为什么?您是否计划定期扩展集群?您的写入一致性级别是多少,因为这对性能有很大影响?显然,如果您只有 2 或 3 个节点并且您正在尝试引导,您会看到速度变慢,因为您占用了集群的很大一部分来进行流式传输。

请注意,“商品硬件”并不意味着廉价、低性能的硬件。这只是意味着您不需要用于 Oracle 等数据库的超高端数据库级机器。您仍然应该使用非常好的商品硬件。您可能还需要更多节点,因为将 RF 设置为等于集群大小通常不是一个好主意。

话虽如此,如果您觉得有帮助,您可以将您listen_address的设置为节点间接口和客户端地址。rpc_address

于 2014-12-11T22:43:55.487 回答