我对 TF 很陌生。我编写了一个 Deep Q-Learning CNN 来控制一个简单的驾驶模拟器。我已经设法在 TensorBoard 上绘制了我的全连接层的权重、偏差和输出,但是我不确定我在寻找什么。我看过一个 youtube 视频,其中提到一组正态分布的权重很好。我想知道是否有人有任何其他调试技巧。另外,我使用 Relu 作为我的激活函数,但是我的许多“奖励”以及 CNN 输出的“质量”都是负面的,我应该使用类似 Sigmoid 的东西吗?我会截取一些我的 TensorBoard 的屏幕截图并发布它们。