我正在尝试 TensorFlow,但遇到了一个奇怪的错误。我编辑了深度 MNIST 示例以使用另一组图像,并且算法再次很好地收敛,直到迭代 8000 左右(此时准确率为 91%),当它因以下错误而崩溃时。
tensorflow.python.framework.errors.InvalidArgumentError: ReluGrad input is not finite
起初我认为可能有些系数达到了浮点数的极限,但是在所有权重和偏差上添加 l2 正则化并不能解决问题。它总是第一个从堆栈跟踪中出来的 relu 应用程序:
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
我现在只在 CPU 上工作。知道什么可能导致这种情况以及如何解决它吗?
编辑:我将其追溯到这个问题Tensorflow NaN 错误?,那里的解决方案有效。