我有一个在 Google AI 平台上训练的深度 CNN/RNN。我使用tf.distribute.MirroredStrategy
. 我最近将我的运行时版本从 1.13 升级到 1.15,我的训练速度比以前慢了 2 倍以上。我读到它tf.estimator.ProfilerHook
可以用来识别性能瓶颈。所以我收集了分析信息并将其呈现在chrome://tracing
. 我懂了
_Send
一个训练步骤在这些操作上花费了整整 1 秒。这是什么?我找不到有关操作的任何文档或为什么它在我的图表中。这是什么意思?