我使用 Strimzi 和 AKS 在 kubernetes 中部署了一个 Kafka 集群和一个 Kafka Connect 集群。我想开始从 RSS 资源中读取数据来为我的 Kafka 集群提供数据,所以我创建了一个“org.kaliy.kafka.connect.rss.RssSourceConnector”的连接器实例,它从特定的 RSS 源读取,给定一个 url,然后写入一个特定的话题。但我的全部意图是最终拥有一个 Kafka Connect 集群,能够管理大量新 RSS 的外部请求以进行读取;这就是我所有疑问的来源:
- 我应该为每个 RSS 提要创建一个 Kaliy RSS 连接器实例吗?还是实现我自己的连接器会更好,所以我只创建它的一个实例,每次我想阅读新的 RSS 提要时,我都会在连接器中创建一个新任务?
- 谁应该负责确保 Kafka Connect Cluster 状态是理想状态?我的意思是如果一个连接器(在 1 个 RSS 提要的情况下:1 个连接器实例)停止工作,谁应该尝试重新启动它?通过 Kafka Connect REST API 的外部客户端?Kubernetes 本身?
现在,我认为我最好的选择是依靠 Kafka Connect REST API 让外部客户端负责管理连接器集的状态,但我不知道这些是否旨在接收大量请求就是这样。也许这些可以通过在 Kafka Connect REST API 配置中配置多个侦听器来扩展,但我不知道。非常感谢!