在深度信念网络的“无监督预训练”之后获得的每一层的权重/成本在应用 dropout 和不应用 dropout 时是否不同?
在使用和不使用 Dropout 对 DBN 进行预训练后,我获得了不同的权重集和不同的成本值。根据我的说法,丢弃单元应该只影响微调阶段,而不是无监督预训练,其中需要所有单元并且没有一个被丢弃。我是概念错了还是代码错了?
在深度信念网络的“无监督预训练”之后获得的每一层的权重/成本在应用 dropout 和不应用 dropout 时是否不同?
在使用和不使用 Dropout 对 DBN 进行预训练后,我获得了不同的权重集和不同的成本值。根据我的说法,丢弃单元应该只影响微调阶段,而不是无监督预训练,其中需要所有单元并且没有一个被丢弃。我是概念错了还是代码错了?