2

对于带有猫图像的 ResNet 模型的 Facebook 实现,我有前向传递的输出张量。那是一个具有分类概率的 1000 维张量。使用torch.topk我可以获得输出张量中的前 5 个概率及其索引。现在我想查看那些最可能的索引的人类可读标签。

我在网上搜索了标签列表(显然也称为 sysnets),只发现了这个:http: //image-net.org/challenges/LSVRC/2015/browse-synsets

我使用行号作为标签索引将这些标签放在一个文件中,当我使用两个不同的猫图像运行网络时,我得到“螺丝刀”作为两者的最高猜测。如果我按字母顺序对标签文件进行排序,我会得到两者的“电影”。

这似乎是将索引转换为标签的问题,对吧?所以......问题是: 如何正确地将网络输出张量中的索引映射到 Imagenet 标签?

4

1 回答 1

2

在 Dato 上找到了关于在 ImageNet 上训练 ConvNets 的教程,最后它包含正确的映射。在此报告以作记录:

{
 0: 'tench, Tinca tinca',
 1: 'goldfish, Carassius auratus',
 2: 'great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias',
 3: 'tiger shark, Galeocerdo cuvieri',
 4: 'hammerhead, hammerhead shark',
 5: 'electric ray, crampfish, numbfish, torpedo',
 6: 'stingray',
 7: 'cock',
 8: 'hen',
 9: 'ostrich, Struthio camelus',
 10: 'brambling, Fringilla montifringilla',
 ... [truncated for space]
 990: 'buckeye, horse chestnut, conker',
 991: 'coral fungus',
 992: 'agaric',
 993: 'gyromitra',
 994: 'stinkhorn, carrion fungus',
 995: 'earthstar',
 996: 'hen-of-the-woods, hen of the woods, Polyporus frondosus, Grifola frondosa',
 997: 'bolete',
 998: 'ear, spike, capitulum',
 999: 'toilet tissue, toilet paper, bathroom tissue'
}

此处的完整映射:https ://gist.github.com/maraoz/388eddec39d60c6d52d4

于 2016-02-20T22:03:39.960 回答