6

我正在使用带有 Kafka-connect 的 mongo-source 插件。我检查了任务状态,它正在运行并监听一个 mongo 集合。

我手动停止了 mongod 服务并等待了大约 1 分钟,然后我重新启动它。

我检查了源任务以查看是否有任何东西可以自行修复,30 分钟后似乎没有任何效果。

只有在重新启动连接器后它才重新开始工作。

由于 mongo-source 没有设置超时时重试 + 回退的选项,我搜索了一个适合简单场景的配置:使用 Kafka-connect 配置在 X 时间后重新启动失败的任务。找不到任何.. :/ 我可以用一个简单的脚本来做到这一点,但是 Kafka-connect 中必须有一些东西可以管理失败的任务。甚至在 mongo-source 中......我不希望它在 1 分钟后失败得这么快......:/

4

1 回答 1

16

除了使用 REST API 来查找失败的任务并提交重新启动请求之外,别无他法——然后定期运行它。例如

curl -s "http://localhost:8083/connectors?expand=status" | \
  jq -c -M 'map({name: .status.name } +  {tasks: .status.tasks}) | .[] | {task: ((.tasks[]) + {name: .name})}  | select(.task.state=="FAILED") | {name: .task.name, task_id: .task.id|tostring} | ("/connectors/"+ .name + "/tasks/" + .task_id + "/restart")' | \
  xargs -I{connector_and_task} curl -v -X POST "http://localhost:8083"\{connector_and_task\}

来源:https ://rmoff.net/2019/06/06/automatically-restarting-failed-kafka-connect-tasks/

于 2020-01-08T20:26:13.393 回答