0

我们正在使用 kubernetes informer(源代码)从 kubernetes api 服务器接收作业更新事件,并且在我们收到这些事件后,我们通常会从集群中删除作业记录。

最近我们发现有很多作业记录留在集群中,因为客户端没有立即收到来自 kuberntes API Server 的 Kubernetes Job Update Event,而是一个多小时后才收到这些事件。

以下是一些信息:

  1. 工作通知回调

    OnAdd(obj interface{})
    OnUpdate(oldObj, newObj interface{})     
    OnDelete(obj interface{})       
    
  2. 集群信息

    kubernetes 版本:v1.20
    client-go 版本:v0.19.6

  3. 其他信息
    那里有1000多个kubernetes Jobs,它们都处于Complete状态,我们不删除它们只是因为我们需要它们来调试其他业务逻辑。

    但是我们发现,去掉那些kubernetes作业,重启informer后,一切都恢复正常了。

如何解决通知延迟?反正有调试这种问题吗?

4

0 回答 0