2

按照https://course.fast.ai/start_gcp.html这个设置:

export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" 
for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-p100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True" \
        --preemptible

得到这个错误:

(gcloud.compute.instances.create) Could not fetch resource: - The resource 'projects/xxxxxx/zones/us-west2-b/acceleratorTypes/nvidia-tesla-p100' was not found

任何人?

4

2 回答 2

5

我尝试复制您在教程中遵循的相同步骤并得到相同的错误。

根据Google 的文档NVIDIA-TESLA-P100仅在以下区域可用:

  • us-west1-a
  • us-west1-b
  • 我们-central1-c
  • us-central1-f
  • us-east1-b
  • 我们-east1-c
  • 欧洲西部1-b
  • 欧洲西部1-d
  • 欧洲西部4-a
  • 亚洲-east1-a
  • 亚洲-east1-c
  • 澳大利亚-东南1-c

并且您可能选择了 us-west2-b,这是不可用的。 因此,我只想将您的区域更改为前面提到的区域之一。

要以更编程的方式获取此列表,例如使用Cloud SDK,您可以发出:

gcloud compute accelerator-types list --filter "name=nvidia-tesla-p100" --format "table[box,title=Zones](zone:sort=1)" 2>/dev/null
于 2019-09-16T08:09:12.263 回答
1

您报告的错误是因为该 GPU 在“us-west2-b”区域中不可用,您可以查看此官方文档中可以使用 GPU 的位置。

在这种情况下,根据您使用的地区,您可以使用:

  • us-west1-a
  • us-west1-b

问候。

于 2019-09-16T07:51:13.010 回答