VGG 和 AlexNet 等需要正方形尺寸的固定图像输入 ( H
== W
)。如何微调或以其他方式执行网络手术,以便提供非平方输入?
供您参考,我正在使用 Caffe 并打算FC7
为非方形图像输入提取特征。
VGG 和 AlexNet 等需要正方形尺寸的固定图像输入 ( H
== W
)。如何微调或以其他方式执行网络手术,以便提供非平方输入?
供您参考,我正在使用 Caffe 并打算FC7
为非方形图像输入提取特征。
对于网络的卷积部分 - 输入大小并不重要:输出的形状会随着输入大小的改变而改变。
然而,当涉及到"InnerProduct"
层时——权重的形状是固定的,它由输入大小决定。
您可以执行“网络手术”将您的"InnerProduct"
图层转换为"Convolution"
图层:这样您的网络可以处理任何大小的输入。但是,您的输出也会在形状上有所不同。
另一种选择是根据新的固定输入大小定义网络,重新使用所有学习到的卷积权重,并且只微调全连接层的权重。