1

我已经使用 kubernetes/client-go 领导选举实现了领导选举。我有 2 个副本。第一次两个 pod 都被选为领导者,但在此之后同一个 pod 没有被选为领导者。一段时间后,领导人选举停止了。我尝试删除一个 pod,然后将创建的新 pod 选为领导者。再次,一旦 pod 停止领导,没有 pod 充当领导者。我正在使用 configmap 进行资源锁定。请帮我解决问题。

func NewElectorWithCallbacks(namespace, configMapName, identity string, ttl time.Duration, client cli.CoreV1Interface, callbacks *leaderelection.LeaderCallbacks) (*leaderelection.LeaderElector, error) {
hostname, err := os.Hostname()
if err != nil {
  return nil, err
}
broadcaster := record.NewBroadcaster()
broadcaster.StartLogging(log.Printf)
broadcaster.StartRecordingToSink(&cli.EventSinkImpl{Interface: client.Events(namespace)})
recorder := broadcaster.NewRecorder(scheme.Scheme, api.EventSource{Component: identity, Host: hostname})
cmLock := &resourcelock.ConfigMapLock{
  Client: client,
  ConfigMapMeta: meta.ObjectMeta{
    Namespace: namespace,
    Name:      configMapName,
  },
  LockConfig: resourcelock.ResourceLockConfig{
    Identity:      identity,
    EventRecorder: recorder,
  },
}
if callbacks == nil {
  callbacks = NewDefaultCallbacks()
}
config := leaderelection.LeaderElectionConfig{
  Lock:          cmLock,
  LeaseDuration: ttl,
  RenewDeadline: ttl / 2,
  RetryPeriod:   ttl / 4,
  Callbacks:     *callbacks,
}
return leaderelection.NewLeaderElector(config)
}

config, err = rest.InClusterConfig()
v1Client, err := v1.NewForConfig(config)
callbacks := &leaderelection.LeaderCallbacks{
        OnStartedLeading: func(context.Context) {
            // do the work
           fmt.Println("selected as leader")
            // Wait forever
            select {}
        },
        OnStoppedLeading: func() {
            fmt.Println("Pod stopped leading")

        },
    }
elector, err := election.NewElectorWithCallbacks(namespace, electionName, hostname, ttl, v1Client, callbacks)
elector.Run(context.TODO())

在此处输入图像描述

4

1 回答 1

1

您可以将 pod 部署为statefullsets& headless service。请参考文档

为什么?

  • Pod 将按顺序创建。您定义要启动的第一个 pod 是Master,其余的是从属。
  • StatefulSet 中的 Pod 具有唯一的序数索引和稳定的网络标识。例如下面,
    kubectl get pods -l app=nginx
    NAME      READY     STATUS    RESTARTS   AGE
    web-0     1/1       Running   0          1m
    web-1     1/1       Running   0          1m

即使 podweb-0重新启动,pod 的名称或 FQDN 也不会改变。

web-0.nginx.default.svc.cluster.local

<pod_name>.<service_name>.<namespace>.svc.cluster.local

我只强调了几点,请完整阅读文档。

于 2019-04-23T07:25:53.407 回答