我最近切换到 TFlearn 来计算我的网络准确性,以便对图像进行分类并创建最先进的结果。我正在使用这个来自 TFlearn 的确切文件,数据集除外。我想重现 VOC2007 数据集的准确性,下载了所有图像和 groundtruth,并编写了一个函数来创建一个包含所有图像的 4D 张量和一个包含所有类索引的 2D 张量。它们的形状分别为 [?, 224, 224, 3] 和 [?, 20]。现在我注意到,类索引不是一个热标签,而是一个图像中可以存在多个类。由于 TFlearn 允许存在多个类,因此网络性能非常差(准确度约为 30%,是的,我更改了输出类的数量)。我想知道,如何解决这个问题。我应该每张图片只允许一个类吗?但是,如果图像中有两个类别,并且我根据第二个类别对其进行正确分类,这将是一个正确的检测,我会将其误分类为错误。我有什么选择吗?我没有看到“one-hot”选项或类似的东西(比如在 oxflowers 数据集中)。
谢谢你的帮助!