我看到 COCO2017 有 80 个类 118k 训练和 5k 验证数据集(122k 图像)。我在这里有个问题。每类的图像数量(每类 1525 张图像)是否约为 122k / 80?
问问题
835 次
1 回答
0
COCO 数据集不是一个均匀分布的数据集,即所有类的图像数量不同。因此,让我向您展示一种方法来找出您想要的任何课程中的图像数量。
我正在使用PyCoco API来处理 COCO 数据集。让我们找出 COCO 数据集的“人”类中的图像数量。这是从 COCO 数据集中过滤掉任何类的代码要点:
# Define the class (out of the 80 COCO classes)
filterClasses = ['person']
# Fetch class IDs only corresponding to the filterClasses
catIds = coco.getCatIds(catNms=filterClasses)
# Get all images containing the above Category IDs
imgIds = coco.getImgIds(catIds=catIds)
print("Number of images containing the class:", len(imgIds))
在那里,我们得到了数据集中与“人”相对应的图像数量!
我最近写了一篇关于探索和操作 COCO 数据集的文章。请查看以获取更多详细信息和整个代码。
于 2020-05-06T13:20:49.080 回答