我正在训练一个分类器来识别图像中的某些对象。我正在使用 Watson Visual Recognition API,但我认为同样的问题也适用于其他识别 API。
我收集了 400 张某物的照片——例如狗。
在我训练 Watson 之前,我可以删除可能会导致问题的图片。我应该删除以下图片:
- 多条狗
- 一只狗与另一只动物
- 一条狗与一个人
- 一只被部分遮住的狗
- 一只戴眼镜的狗
此外,白色背景的狗会成为更好的训练样本吗?
沃森也举了负面的例子。猫和其他小动物会是很好的反面例子吗?还有什么?
我正在训练一个分类器来识别图像中的某些对象。我正在使用 Watson Visual Recognition API,但我认为同样的问题也适用于其他识别 API。
我收集了 400 张某物的照片——例如狗。
在我训练 Watson 之前,我可以删除可能会导致问题的图片。我应该删除以下图片:
此外,白色背景的狗会成为更好的训练样本吗?
沃森也举了负面的例子。猫和其他小动物会是很好的反面例子吗?还有什么?
你说得对,这是各种自定义分类器和识别器的普遍问题——无论是vize.it、clarifai、IBM Watson,还是在 caffe 中自行训练神经网络。(按您需要使用的示例图像数量排序。)
您需要问的重要问题是您将如何使用分类器?您将输入机器以预测显示的对象的真实图像是什么?作为一般规则,您的训练图像应尽可能与预测时间图像相似——无论是在它们描绘的内容(对象的种类和种类)以及它们如何描绘它(例如背景)方面。神经网络非常强大,如果你给它们提供足够多的图像,它们甚至可以学习困难的情况。
也许您想在用户的文件夹中找到狗的图像——其中包括家庭照片、屏幕截图和文档扫描。在训练集中反映这种多样性。询问用户是否应将与其他动物的狗标记为狗照片。
也许您想在荒野照片陷阱上找到狗的图像。只需使用该照片陷阱(或多个照片陷阱,如果它是整个网络)拍摄的各种图像。
简而言之——根据手头的任务定制您的示例图像!