看了Tensorflow开发者的峰会视频Eager Execution in Tensorflow,主持人介绍了“渐变胶带”。现在我了解到梯度磁带跟踪 TF 模型中发生的自动微分。
我试图理解为什么我会使用渐变胶带?谁能解释梯度胶带如何用作诊断工具?为什么有人会使用 Gradient Tape 而不是仅仅使用 Tensorboard 的权重可视化。
所以我知道模型发生的自动微分是计算每个节点的梯度——这意味着在给定一批数据的情况下调整每个节点的权重和偏差。这就是学习过程。但我的印象是,我实际上可以使用tf.keras.callback.TensorBoard()
调用来查看训练的 tensorboard 可视化——所以我可以观察每个节点上的权重,并确定是否有死节点或过饱和节点。
使用渐变胶带是否只是为了查看某些渐变是否变为零或变得非常大等?或者渐变胶带还有其他用途吗?