我通过kubectl create -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.9/nvidia-device-plugin.yml创建了一个 pod
但是,我注意到没有 nodeSelector。那么如何将 pod 正确部署到目标 gpu 机器?为什么它选择跳过主控机?AFAK,守护进程使其 pod 部署在每个节点上,而不仅仅是集群的一部分,而无需指定任何节点选择器。
部分清单:
QoS Class: BestEffort
Node-Selectors: <none>
Tolerations: CriticalAddonsOnly
node.kubernetes.io/disk-pressure:NoSchedule
node.kubernetes.io/memory-pressure:NoSchedule
node.kubernetes.io/not-ready:NoExecute
node.kubernetes.io/pid-pressure:NoSchedule
node.kubernetes.io/unreachable:NoExecute
node.kubernetes.io/unschedulable:NoSchedule
事件:
集群信息:
2台机器,一台作为master,只有一个CPU,另一台作为worker,里面有cpu和gpu。
Kubernetes:1.15