2

VGG 和 AlexNet 等需要正方形尺寸的固定图像输入 ( H== W)。如何微调或以其他方式执行网络手术,以便提供非平方输入?

供您参考,我正在使用 Caffe 并打算FC7为非方形图像输入提取特征。

4

1 回答 1

1

对于网络的卷积部分 - 输入大小并不重要:输出的形状会随着输入大小的改变而改变。
然而,当涉及到"InnerProduct"层时——权重的形状是固定的,它由输入大小决定。

您可以执行“网络手术”将您的"InnerProduct"图层转换为"Convolution"图层:这样您的网络可以处理任何大小的输入。但是,您的输出也会在形状上有所不同。

另一种选择是根据新的固定输入大小定义网络,重新使用所有学习到的卷积权重,并且只微调全连接层的权重。

于 2015-11-22T07:15:24.847 回答