“cross-entropy”的相关标签问题

0 投票

1 回答

974 浏览

tensorflow - 为什么带有 sigmoid 的神经网络的代码与带有 softmax_cross_entropy_with_logits 的代码如此不同？

在使用神经网络进行分类时，据说：

您通常希望使用 softmax 交叉熵输出，因为这为您提供了每个可能选项的概率。
在只有两个选项的常见情况下，您想使用 sigmoid，除了避免冗余输出 p 和 1-p 之外，这是一样的。

在 TensorFlow 中计算 softmax 交叉熵的方法似乎是这样的：

所以输出可以直接连接到最小化代码，这很好。

我的 sigmoid 输出代码同样基于各种教程和示例，大致如下：

我原以为两者在形式上应该相似，因为它们以几乎相同的方式完成相同的工作，但上面的代码片段看起来几乎完全不同。此外，sigmoid 版本显式地平方误差，而 softmax 则没有。（平方是在 softmax 的实现中发生的，还是发生了其他事情？）

以上其中一项是完全不正确的，还是有理由让它们完全不同？

2018-03-28T06:22:02.477

0 投票

0 回答

380 浏览

python - 忽略/屏蔽某些标签 Softmax 交叉熵

在尝试使用此处描述的 L2 正则化实现交叉熵损失A Fast and Accurate Dependency Parser using Neural Networks时，我得到了错误：ValueError: Cannot feed value of shape (48,) for Tensor u'Placeholder_2:0', which has shape '(48, 1)在训练的几个步骤中得到负损失后。我的损失如下：

并且是第0步的负值。我相信我的问题是一些标签是-1并且应该被忽略，如论文中所述：“一个轻微的变化是我们仅在实践中的可行转换中计算softmax概率”。在计算损失时，我将如何忽略这些标签？

python tensorflow cross-entropy dependency-parsing

2018-04-06T04:43:38.083

0 投票

1 回答

1925 浏览

tensorflow - TensorFlow 的 sparse_softmax_cross_entropy 中的 Logits 表示

我对sparse_softmax_cross_entropyTensorFlow 中的成本函数有疑问。

我想在语义分割上下文中使用它，其中我使用自动编码器架构，该架构使用典型的卷积操作对图像进行下采样以创建特征向量。这个向量比上采样（使用conv2d_transpose和一个一个的卷积来创建输出图像。因此，我的输入由形状为的单通道图像组成(1,128,128,1)，其中第一个索引表示批量大小，最后一个索引表示通道数。图像的像素当前是0或1。所以每个像素都映射到一个类。自动编码器的输出图像遵循相同的规则。因此，我不能使用任何预定义的成本函数，而不是MSE前面提到的一个。

网络与MSE. 但我无法让它与sparse_softmax_cross_entropy. 在这种情况下，这似乎是正确的成本函数，但我对logits. 官方文档说 logits 应该有 shape (d_i,...,d_n,num_classes)。我试图忽略该num_classes部分，但这会导致一个错误，指出只[0,1)允许间隔。当然，我需要指定将允许间隔变为的类数，[0,2)因为排他上限显然是num_classes.

有人可以解释如何将我的输出图像转换为所需的 logits 吗？

成本函数的当前代码是：

挤压删除标签输入的最后一个维度，为的标签创建形状[1 128 128]。这会导致以下异常：

编辑：

根据要求，这是一个在全卷积网络的上下文中验证成本函数行为的最小示例：

constructor剪断：

build_model()剪断：

init_optimizer()剪断：

tensorflow neural-network deep-learning autoencoder cross-entropy

2018-04-17T16:57:36.363

0 投票

1 回答