我们正在与一家拥有超过 200 万张 jpeg 图像的公司合作。他们想收集更多图像。图像的目的是机器分类和寻找螺栓和小漏水等小物体。图像的数量很多,但训练的样本很少,可能只有 100 个样本或更少。
我们对公司的建议是以未压缩的原始 10 或 12 位 png/tiff 格式存储数据。他们想使用 jpeg 格式,因为他们可以在更短的时间内收集更多的数据(每秒 4 张图像)并且不需要所有的磁盘空间。
有谁知道 jpeg 与 png 格式相比的存储将如何影响样本的训练以及以后的查找/分类?
我用谷歌搜索过。它返回了许多关于如何通过使用深度学习来提高 jpeg 质量的答案。其余的答案是关于如何使用互联网上的图书馆处理猫和狗。有一篇文章说 jpeg 压缩会影响识别,但很少涉及什么样的图像,你要寻找什么类型的对象等。
当您寻找像狗和猫这样的大型物体时,您将拥有许多可以使用的特征、曲线、颜色、直方图和其他特征。寻找具有很少特征的非常小的对象更为复杂。
有谁知道关于这个主题的任何文章?关键问题:我应该将图像存储在 png 或无损 tiff 中,还是可以使用 jpeg 压缩以供以后在深度学习中使用?