1

我正在运行一个 Google Colab 笔记本并试图捕获 TPU 分析数据以在 TensorBoard 中使用,但是capture_tpu_profile在运行我的 TensorFlow 代码时我无法在后台运行。

到目前为止,我尝试在后台运行捕获过程:

!capture_tpu_profile --logdir=gs://<my_logdir> --tpu=$COLAB_TPU_ADDR &

!bg capture_tpu_profile --logdir=gs://<my_logdir> --tpu=$COLAB_TPU_ADDR
4

2 回答 2

5

原来这样做的一种方法是直接从 python 开始这个过程(我还必须修改参数 from --tputo --service_addr):

import subprocess
subprocess.Popen(["capture_tpu_profile","--logdir=gs://<my_logdir>", "--service_addr={}".format(os.environ['COLAB_TPU_ADDR'])])

如果命令失败,则check=True使命令引发异常。

于 2018-11-11T22:54:55.097 回答
0

一种方法是使用 TPUProfilerHook

https://github.com/tensorflow/tpu/blob/master/models/common/tpu_profiler_hook.py

它将探查器作为会话挂钩运行。

此处示例https://github.com/tensorflow/tpu/blob/5d838047af0163bdf7b97b9404648dc2961c4b63/models/official/resnet/resnet_main.py#L699

于 2019-02-04T18:26:26.463 回答