如何在 AI Platform Pipelines 上使用 GPU?我的管道在其中一个操作中使用了 set_gpu_limit(1) 但我最终得到了一个This step is in Pending state with this message: Unschedulable: 0/3 nodes are available: 3 Insufficient nvidia.com/gpu.
错误。
问问题
92 次
1 回答
1
几分钟后明白了……我按照GPU 上的正常 Kubeflow 指令进行操作
export GPU_POOL_NAME=gpu-pool
export CLUSTER_NAME=cluster-1
gcloud container node-pools create ${GPU_POOL_NAME} \
--accelerator type=nvidia-tesla-k80,count=1 \
--zone us-central1-a --cluster ${CLUSTER_NAME} \
--num-nodes=0 --machine-type=n1-standard-4 --min-nodes=0 --max-nodes=1 --enable-autoscaling
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/container-engine-accelerators/master/nvidia-driver-installer/cos/daemonset-preloaded.yaml
于 2020-12-16T18:15:30.787 回答