我有大量不同形状、大小、照明、颜色等的“苹果”图像。这些“苹果”图像是不同角度的更大图像的一部分。
现在我想训练暗网检测图像中的“苹果”。我不想经历注释过程,因为我已经裁剪出准备好的苹果 jpg 图像。
我可以使用这些准备好的和裁剪的“苹果”图像来训练暗网还是我仍然需要经过注释过程?
我有大量不同形状、大小、照明、颜色等的“苹果”图像。这些“苹果”图像是不同角度的更大图像的一部分。
现在我想训练暗网检测图像中的“苹果”。我不想经历注释过程,因为我已经裁剪出准备好的苹果 jpg 图像。
我可以使用这些准备好的和裁剪的“苹果”图像来训练暗网还是我仍然需要经过注释过程?
在对象检测模型中,您对图像中的对象进行注释,因为它将了解对象在特定图像中的位置。如果您有一个仅包含苹果图像的整个数据集,则模型将以一种方式学习,即您提供的每张图像都将包含唯一的苹果。因此,即使您提供“橙色”作为测试图像,它仍然可能给苹果,因为它不知道除了苹果之外的其他类。
所以有两个重要的点需要考虑:
您的回答与我们称为“数据增强”的过程有关。你可以用谷歌搜索其他人的做法。
由于您的苹果图像都已准备好裁剪,因此您可以假设所有苹果图像都已按其完整尺寸进行了标记。然后收集一些尺寸都比任何苹果图像都大的背景图像。现在您可以编写一个工具来随机选择一个苹果图像并将其与您随机选择的背景相结合,以生成带有背景的“新”苹果图像。既然你必须知道每个苹果图像的大小,你肯定可以计算出边界框的大小及其位置,然后生成它的标签文件。