我试图在CloudML引擎上使用TPU,但是我对如何提供 tpu 论证哪个 TPUClusterResolver 期待。
tpu
TPUClusterResolver
这是我使用的环境:
--python-version 3.5 \ --runtime-version 1.12 \ --region us-central1 \ --scale-tier BASIC_TPU
该作业因以下原因崩溃:
ValueError: Please provide a TPU Name to connect to.
作为一个单独的问题,ML引擎似乎正在添加 --master grpc://10.129.152.2:8470 就我自己的工作而言,这也会使工作崩溃。为了解决这个问题,我在代码中添加了一个未使用的主标志。
--master grpc://10.129.152.2:8470
这是运行时1.11和1.12的已知问题,已修复。现在,服务不会追加 --master 你的培训申请表。您应该继续使用 TpuClusterResolver .
--master
TpuClusterResolver