2

我正在尝试在 Cloud ML Engine 上使用 TPU,但我不知道应该如何提供预期的tpu论点。TPUClusterResolver

这是我正在使用的环境:

--python-version 3.5 \
--runtime-version 1.12 \
--region us-central1 \
--scale-tier BASIC_TPU

作业因以下原因而崩溃:

ValueError: Please provide a TPU Name to connect to.

作为一个单独的问题 - ML 引擎似乎正在自行添加--master grpc://10.129.152.2:8470到我的工作中,这也使工作崩溃。作为一种解决方法,我只是在我的代码中添加了一个未使用的主标志。

4

1 回答 1

0

这是运行时 1.11 和 1.12 的已知问题,现已修复。现在,该服务不会附加--master到您的培训应用程序中。您应该继续使用TpuClusterResolver.

于 2019-01-25T22:27:23.540 回答