我使用预训练的图像分类器来评估输入数据处理。我下载了 ImageNet ILSVRC2014 CLS-LOC 验证数据集以用作基础。我需要知道图像的实际类别来评估我的治疗(需要检测正确的分类)。在 2014 年工具包中有 ILSVRC2014_clsloc_validation_ground_truth.txt 文件,根据自述文件,该文件应该包含数据集中 50 000 张图像的类标签(以 ID:s 的形式)。文件中有 50 000 个条目/行,所以到目前为止一切看起来都不错,但我也想要相应的语义类标签/名称。
我在网上的几个地方找到了这些,它们似乎是连贯的(1000 节课)。但后来我看了第一张图片,它是一条蛇,第一张图片的基本事实是 490,语义名称列表中的第 490 行是“链”。这很奇怪,但仍然很接近。第二张图片是两人滑雪,派生类“polecat”。我尝试了更多类似的结果。
我一定是误会了什么。基本事实不应该是验证集的“正确”答案吗?我错过了 ID:s 和语义标签之间的翻译吗?
2014 imagenet dev-kit 中的自述文件指出:“总共有 50,000 个验证图像。它们被命名为
ILSVRC2012_val_00000001.JPEG
ILSVRC2012_val_00000002.JPEG
...
ILSVRC2012_val_00049999.JPEG
ILSVRC2012_val_00050000.JPEG
每个同义词集有 50 个验证图像。
验证图像的分类基础事实在 data/ILSVRC2014_clsloc_validation_ground_truth.txt 中,其中每一行包含一个图像的一个 ILSVRC2014_ID,按图像文件名的字母升序排列。
验证图像的本地化基本事实可以 xml 格式下载。"
我这样做是我学士论文的一部分,我真的很想把它做好。
提前致谢