我正在使用自动编码器进行无监督学习。我在想[在测试时]跳过一个输入是否会影响输出准确性,因为我的输入都是标称的和数字的。它是否能够保持输入之间学习到的关系并在没有一个输入的情况下准确预测?
问问题
65 次
1 回答
0
我在想[在测试时]跳过一个输入是否会影响输出准确性......
您的问题非常笼统,但简而言之:这取决于。
例如,如果您有 1000 个输入并且训练规模为 1,000,000,那么“跳过一个输入”可能仍然有效。但是,假设有 2 个输入,那么跳过一个输入会产生巨大的差异。
但是,为了获得更大的弹性,您的网络可以构建为允许更好地识别错误输入的模式。有很多关于这方面的文献,但出于理论目的,我将在某些假设下概述一种可能的方法。
假设有足够数量的输入,并假设有足够数量的测试数据,您可以从系统中创建 N 个隐藏神经网络,每个 N-1 个输入组合一个。这将是笨拙的,但可能的,实际上有更好的方法(但更多关于下一段)。然后在您的训练集中,如果您跳过其中一个输入,这些隐藏网络中的一个将针对该输入进行非常准确的训练。通过这种方式,您的网络可以被训练以允许丢失的输入。
实际上,您不需要单独考虑丢失输入的 N 种可能性中的每一种。神经网络有很多异花授粉,所以一个足够密集的隐藏网络应该就可以了。
于 2015-12-22T16:16:59.750 回答