python - 激活或权重的丢失

Question

一个相当简单的，但现在只是变得疯狂。

当应用 dropout 来规范我的神经网络时，它应该应用在哪里？

例如，让我们假设 2 个卷积层后跟 1 个全连接层。“A2”是第二个卷积层的激活。我应该将 dropout 应用于这些激活，还是应该将其应用于以下全连接层的权重？还是真的不重要？

我的直觉告诉我，正确的做法是在全连接层的权重上应用 dropout，而不是在第二个 conv 层的激活上，但我在很多地方都看到了相反的情况。

我见过两个类似的问题，但都没有一个令人满意的答案。

score 6 · Accepted Answer

两者都是有效的。当你放弃激活时，它被称为dropout，当你放弃权重时，它被称为dropconnect。DropConnect 是 DropOut 方法的通用版本。DropConnect 论文中的这张图片很好地解释了这一点。

在 Dropconnect 的情况下，如果节点的所有权重u3都为零（3/4 为零），这与在r3节点上应用 dropout 相同。另一个区别在于权重的掩码矩阵。

左图表示 dropconnect 的掩码矩阵，右图表示将 dropout 应用于两个连续层时的有效掩码矩阵。注意 dropout 的掩码矩阵中的模式。作者表明， dropconnect 在基准数据集中击败了 dropout，并产生了最先进的结果。

因为，dropconnect 是我会使用的通用版本。

1 回答 1