3

我是一个初学者,正在逐步学习深度学习。我有一个关于设计网的问题。我在论文中看到,有不同输入/输出的层,我不知道如何在实现之前计算/设计。例如,在本文中,在原理图图层输出旁边有一些数字(见下图)。如何为具有特定图像大小作为输入的网络指定这些过滤器大小和其他参数。 在此处输入图像描述

或在另一篇论文中,它们具有以下设计: 在此处输入图像描述

他们已经提到,对于256x256输入图像,网络的总子采样因子是4,导致 a 64x64xL array,其中 L 是类标签的数量。这个64x64尺寸是如何获得的?

我如何学习设计网络并计算层的输入/输出?

感谢您的任何帮助

4

1 回答 1

2
  1. 如果您合并两次,stride=2则意味着您将图像大小减少 2 倍,从而导致图像大小总共减少 4 倍(子采样)。因此,如果您从大小为 256 的图像开始:256/4=64。

  2. 如何选择内核大小、每层输出数量、步幅等设计参数?实际上没有单一的答案,基本上许多论文/作品使用不同的设置来处理相同的任务。AFAIK 没有明确的指导方针或适合任何特定任务的明显参数选择。
    话虽如此,您可以找到这项调查一些新兴深度网络设计模式的工作。

于 2017-02-21T08:07:40.937 回答