2

我正在训练一个分类器来识别图像中的某些对象。我正在使用 Watson Visual Recognition API,但我认为同样的问题也适用于其他识别 API。

我收集了 400 张某物的照片——例如狗。

在我训练 Watson 之前,我可以删除可能会导致问题的图片。我应该删除以下图片:

  1. 多条狗
  2. 一只狗与另一只动物
  3. 一条狗与一个人
  4. 一只被部分遮住的狗
  5. 一只戴眼镜的狗

此外,白色背景的狗会成为更好的训练样本吗?

沃森也举了负面的例子。猫和其他小动物会是很好的反面例子吗?还有什么?

4

1 回答 1

5

你说得对,这是各种自定义分类器和识别器的普遍问题——无论是vize.itclarifaiIBM Watson,还是在 caffe 中自行训练神经网络。(按您需要使用的示例图像数量排序。)

您需要问的重要问题是您将如何使用分类器?您将输入机器以预测显示的对象的真实图像是什么?作为一般规则,您的训练图像应尽可能与预测时间图像相似——无论是在它们描绘的内容(对象的种类和种类)以及它们如何描绘它(例如背景)方面。神经网络非常强大,如果你给它们提供足够多的图像,它们甚至可以学习困难的情况。

也许您想在用户的文件夹中找到狗的图像——其中包括家庭照片、屏幕截图和文档扫描。在训练集中反映这种多样性。询问用户是否应将与其他动物的狗标记为狗照片。

也许您想在荒野照片陷阱上找到狗的图像。只需使用该照片陷阱(或多个照片陷阱,如果它是整个网络)拍摄的各种图像。

简而言之——根据手头的任务定制您的示例图像!

于 2016-10-31T19:21:49.427 回答