我在 Python 3.0 中使用 Tensorflow(使用 Keras API)。我正在使用 VGG19 预训练网络在 Nvidia RTX 2070 上执行样式转换。
我拥有的最大输入图像是 4500x4500 像素(我已经删除了 VGG19 中的全连接层,以允许处理任意图像大小的全卷积网络。)如果有帮助,我的批量大小只是 1 个图像目前时间。
1.) 考虑到我不是在训练模型,而只是通过预训练模型传递数据,是否有一个选项可以在图像输入上并行化模型评估?
2.) 在从 1 个 GPU 到 2 个 GPU 的过程中,处理更大图像的能力是否有所增加?有没有办法在 GPU 之间共享内存?
我不确定较大的图像是否会使我的 GPU 计算受限或内存受限。我推测这是一个计算问题,这就是我开始搜索并行 CNN 评估讨论的原因。我看过一些关于平铺方法的论文,这些方法似乎允许更大的图像