3

我已经使用 caffe 和 DIGITS 接口使用 LeNet 训练了我自己的图像数据集(交通灯图像 11x27)。我得到了 99% 的准确率,当我通过 DIGITS 提供新图像时,它会预测出好的标签,因此网络似乎工作得很好。

但是,我很难通过 Python/Matlab API for caffe 预测标签。最后一层输出 (ip2) 是一个包含 2 个元素的向量(我有 2 个类),例如,它看起来像 [4.8060, -5.2608] (第一个分量始终为正,第二个始终为负,绝对值范围为 4至 20)。我从 Python、Matlab 和 DIGITS 的许多测试中知道这一点。

我的问题是:

  • Argmax 不能直接在这一层上工作(它总是给 0)
  • 如果我使用 softmax 函数,它总是会给我 [1, 0] (这实际上是python 接口中的值,无论我的图像是什么类net.blobs['prob']out['prob']

那么,我怎样才能得到预测的好标签呢?

谢谢!

4

0 回答 0