我们正在使用 kubernetes informer(源代码)从 kubernetes api 服务器接收作业更新事件,并且在我们收到这些事件后,我们通常会从集群中删除作业记录。
最近我们发现有很多作业记录留在集群中,因为客户端没有立即收到来自 kuberntes API Server 的 Kubernetes Job Update Event,而是一个多小时后才收到这些事件。
以下是一些信息:
工作通知回调
OnAdd(obj interface{}) OnUpdate(oldObj, newObj interface{}) OnDelete(obj interface{})
集群信息
kubernetes 版本:
v1.20
client-go 版本:v0.19.6
其他信息
那里有1000多个kubernetes Jobs,它们都处于Complete状态,我们不删除它们只是因为我们需要它们来调试其他业务逻辑。但是我们发现,去掉那些kubernetes作业,重启informer后,一切都恢复正常了。
如何解决通知延迟?反正有调试这种问题吗?