我正在部署我的 conv-deconv 网络。我的问题是交叉熵在训练时总是 nan ,所以求解器没有更新权重。我整天检查我的代码,但我不知道我哪里出错了。以下是我的架构: 这是我的交叉熵函数
ys_reshape = tf.reshape(ys,[-1,1])
prediction = tf.reshape(relu4,[-1,1])
cross_entropy = tf.reduce_mean(-(ys_reshape*tf.log(prediction)))
train_step = tf.train.AdamOptimizer(0.01).minimize(cross_entropy)
其中ys的维度是[1,500,500,1],ys_reshape是[250000,1],relu4是[1,500,500,1],预测是[250000,1]。标签矩阵ys的值为{0,1},是一个二分类稠密预测。
如果我打印 train_step out,它将显示 None。谁能帮我?