4

在 Apache Pulsar 主题文档中,它说我们可以将主题时间保留策略设置为 -1 以实现基于无限时间的保留,无限保留的缺点是什么,我们可以使用 pulsar 作为消息存储,其中数据永远存在于主题中并构建事件源他们周围的应用程序?

4

3 回答 3

9

缺点是您的数据将永远增长。但是,由于底层存储(簿记员)的基于分段的架构,可以通过添加存储节点来添加更多空间(即,所有数据不必像其他一些系统那样放在一台机器上)。

基于段的架构还使得将数据移动到大容量存储系统(s3 或其他东西)变得相当简单,同时仍然可以从 Pulsar 获得它。但是,目前这仍处于讨论的早期阶段。

于 2018-03-14T16:22:31.227 回答
3

实际上,您可以并且应该使用Pulsar 的分层存储选项将旧数据卸载到更具成本效益的存储,例如 S3、Google Blob 存储或 HDFS。与 Kafka 不同,Pulsar 将服务层与存储层分离,从而实现了这一点。在 Kafka 中,您将不得不“无休止地添加硬盘”和代理实例来存储它们。

于 2019-09-17T23:12:37.280 回答
0

使用 Pulsar 的优势是一个更好的选择,因为它为您的数据存储提供了更多的组织。由于 Pulsar 的优势是将分层存储与主题分开的存储层,因此我建议采用这条路线,因为您的数据将使我更安全且更易于访问。

于 2021-07-01T12:34:38.947 回答