我已经实现了我自己的 Viola Jones 人脸识别算法版本,它使用 AdaBoost 作为构建分类委员会的元数据。我的目标是建立一个可以识别图像中是否有人脸的分类器。我正在努力寻找足够的训练数据集来尝试该算法。特别是我不知道在哪里可以找到一组负面图像(即不包含面部的图像)。对于正数据集,我将尝试 Wild dataset链接中的 Labeled Faces 。
什么是好的负面数据集?
我已经实现了我自己的 Viola Jones 人脸识别算法版本,它使用 AdaBoost 作为构建分类委员会的元数据。我的目标是建立一个可以识别图像中是否有人脸的分类器。我正在努力寻找足够的训练数据集来尝试该算法。特别是我不知道在哪里可以找到一组负面图像(即不包含面部的图像)。对于正数据集,我将尝试 Wild dataset链接中的 Labeled Faces 。
什么是好的负面数据集?
一些可能适用于您的问题的解决方案是:
环顾一番后,这个资源似乎有一个非人脸数据集。
您可能会考虑构建自己的数据集。如果您要使用 LFW 数据集和严重受限(裁剪)的图像,您可以获取一个缩小照片的数据库,无论有没有人,在其上运行标准人脸检测算法以确定人脸的位置,然后裁剪出人脸大小的部分,无论是在裁剪区域中有人脸还是没有人脸的情况下。一些数据集,例如VGG face,具有人脸图像,并给出了它们的边界框。您可以考虑使用类似的东西。
您还可以使用任何您知道其中没有面孔的数据集,只要它描述了您的算法可能遇到的场景。例如,CIFAR 10 和 CIFAR 100 集有很棒的户外场景,包括一些动物面孔的特写,这可能对您的算法不利。你可以在这里找到它。另一个是图像网络集。
选择此数据集时应小心,因为如果您不小心,它很容易引入偏差。