我正在尝试学习(和比较)不同的深度学习框架,当时它们是 Caffe 和 Theano。
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
和
http://deeplearning.net/tutorial/lenet.html
我按照教程在 MNIST 数据集上运行这些框架。但是,我注意到在准确性和性能方面存在很大差异。
对于 Caffe,准确率提高到 97% 的速度非常快。事实上,完成程序(使用 GPU)只需要 5 分钟,在测试集上的最终准确率超过 99%。多么令人印象深刻!
但是,在 Theano 上,它要差得多。我花了超过 46 分钟(使用相同的 GPU),才达到 92% 的测试性能。
我很困惑,因为在相同数据集上运行相对相同架构的框架之间应该没有太大区别。
所以我的问题是。Caffe 报告的准确率是测试集上正确预测的百分比吗?如果是这样,对这种差异有什么解释吗?
谢谢。