我一直在努力让“softmax_cross_entropy_with_logits”作为我的成本函数的一部分来解决 147 类问题。我有使用“sigmoid_cross_entropy_with_logits”的代码,但想转移到 softmax。
我已经尝试了许多不同的尝试,通过从 3 级重塑到 2 级(没有帮助)来让代码工作,然后就卡住了。我已经通过 Notebook 尝试了一些玩具代码,而 softmax_cross .... 没有断言错误。还尝试将 float32 转换为 float64 (因为我的笔记本示例使用 64 位并且有效)但仍然断言错误。
这是玩具代码:
y_hat_softmax = tf.nn.softmax(y_hat)
sess.run(y_hat_softmax)
# array([[ 0.227863 , 0.61939586, 0.15274114],
# [ 0.49674623, 0.20196195, 0.30129182]])
y_true = tf.convert_to_tensor(np.array([[0.0, 1.0, 0.0],[0.0, 0.0, 1.0]]))
sess.run(y_true)
# array([[ 0., 1., 0.],
# [ 0., 0., 1.]])
loss_per_instance_2 = tf.nn.softmax_cross_entropy_with_logits(y_hat, y_true)
sess.run(loss_per_instance_2)
# array([ 0.4790107 , 1.19967598])
cross_ent = tf.nn.softmax_cross_entropy_with_logits(y_hat, y_true)
print sess.run(cross_ent)
#[ 0.4790107 1.19967598]
print y_hat
#Tensor("Const:0", shape=(2, 3), dtype=float64)
print y_true
#Tensor("Const_1:0", shape=(2, 3), dtype=float64)
total_loss_2 = tf.reduce_mean(cross_ent)
sess.run(total_loss_2)
# 0.83934333897877922
这是我的代码片段:(尺寸在下面打印错误)
self.error0 = tf.nn.softmax_cross_entropy_with_logits(tf.to_double(self.outputSplit0), tf.to_double(self.YactSplit0), "SoftMax0")
self.error1 = tf.nn.softmax_cross_entropy_with_logits(self.outputSplit1, self.YactSplit1, "SoftMax1")
self.error = self.error0 + self.error1
我想要做的是每个结果都有 2 个编码的“单词”,所以我现在尝试分别计算每个单词的错误,但仍然没有用。错误发生在上面的第一行:
self.outputSplit0 Tensor("LSTM/Reshape_2:0", shape=(8000, 147), dtype=float32)
self.YactSplit0 Tensor("LSTM/Reshape_4:0", shape=(8000, 147), dtype=float32)
Traceback (most recent call last):
File "modelbuilder.py", line 352, in <module>
brain.create_variables()
File "/home/greg/Model/LSTM_qnet.py", line 58, in create_variables
self.error0 = tf.nn.softmax_cross_entropy_with_logits(tf.to_double(self.outputSplit0), tf.to_double(self.YactSplit0), "SoftMax0")
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/nn_ops.py", line 1436, in softmax_cross_entropy_with_logits
precise_logits = _move_dim_to_end(precise_logits, dim, input_rank)
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/nn_ops.py", line 1433, in _move_dim_to_end
0, [math_ops.range(dim_index), math_ops.range(dim_index + 1, rank),
File "/home/greg/tensorflow/_python_build/tensorflow/python/ops/math_ops.py", line 1094, in range
assert all(arg.dtype in dtype_hierarchy for arg in [start, limit, delta])
AssertionError
有什么想法可能在这里发生吗?错误似乎来自“范围”功能,只是无法弄清楚我做错了什么。