computer-vision - 计算机视觉数据集

Question

我正在测试用于图像分类的计算机视觉算法。我想找到一个包含几类对象的数据集，例如猫和狗。该数据集应具有每个类别内的所有可变性，这是由于该类别的内在可变性。也就是说，我不想担心从不同视点或在不同照明条件下拍摄的照片等。几乎所有类别内的可变性都应归因于该类别的内在可变性，例如猫的类别将包含许多不同的图像是因为猫实际上看起来彼此不同，而不是因为这些图像是在不同的条件下产生的。

优选地，对象将被“切掉”（在统一的背景上）。数据集的大小并不重要。合成图像（可能使用 3D 图形软件生成）也可以。图像需要标有它们的类别。

有谁知道这样的数据集？

score 6 · Accepted Answer

Computer Vision Online 似乎有一个非常全面的 CV 和图像处理数据集列表： http ://computervisiononline.com/datasets

score 5 · Accepted Answer

试试 caltech 256 数据集：http: //www.vision.caltech.edu/Image_Datasets/Caltech256/

它还将为您提供与社区中使用的其他算法进行比较的良好基础。

score 5 · Accepted Answer

几年前我用这个库尝试了 SVM：

http://www.cs.columbia.edu/CAVE/software/softlib/coil-100.php

score 3 · Accepted Answer

我列出了一些我们在博士期间一直在研究的图像数据集——但你应该在网上找到很多。根据您的描述，您正在寻找具有groundtruth 的对象识别任务或分割数据集。

ALOI数据集可能会让您感兴趣：“ALOI 是一个包含一千个小物体的彩色图像集合，用于科学目的。为了捕捉物体记录中的感官变化，我们系统地改变了视角、照明角度和照明“为每个对象添加颜色，并额外捕获宽基线立体图像。我们记录了每个对象的一百多张图像，总共为该集合产生了 110,250 张图像。”

交通标志识别数据集对您来说可能也很有趣。IIRC 还有用于交通标志的地面实况分割掩码。

在任何一种情况下，您都应该能够用您想要的任何内容替换背景（如果您想让任务变得更复杂）。

祝你识别任务好运（如果它仍然相关）。

score 2 · Accepted Answer

我认为CIFAR 数据集可能会对您有所帮助。它说它涉及 8000 万个微小图像数据集的标记子集。通过提供的方式在 Python、Matlab 或 C（二进制版本）上加载数据集似乎很容易。

score 1 · Accepted Answer

也就是说，我不想担心从不同视点或在不同照明条件下拍摄的照片等。几乎所有类别内的可变性都应归因于该类别的内在可变性，例如猫的类别将包含许多不同的图像是因为猫实际上看起来彼此不同，而不是因为这些图像是在不同的条件下产生的。

这不太现实。事实上，您最终会得到一个在实践中根本无法运行的系统——或者只能在非常受限的环境中运行。

我知道的一个这样的数据集（我不关心这样的数据集）是UIUC 汽车数据集。该数据库包含用于评估对象检测算法的汽车侧视图图像。（单尺度+多尺度）

score 0 · Accepted Answer

尝试 PASCAL、ImageNet 和 SUN。加州理工学院和 MSRC 已经过时了。

您可能还想阅读这篇论文：Unbiased Look at Dataset Bias - Torralba(MIT) & Efros (CMU)：people.csail.mit.edu/torralba/publications/datasets_cvpr11.pdf‎</p>

computer-vision - 计算机视觉数据集

7 回答 7

Related

Reference