4

我使用本地和后端 tensorflow 创建了完全相同的网络,但在使用多个不同参数进行了数小时的测试后,仍然无法弄清楚为什么 keras 优于本地 tensorflow 并产生更好(稍微但更好)的结果。

Keras 是否实现了不同的权重初始化方法?或执行除 tf.train.inverse_time_decay 之外的不同权重衰减方法?

ps分数差总是像

Keras with Tensorflow: ~0.9850 - 0.9885 - ~45 sec. avg. training time for 1 epoch
Tensorflow Native ~0.9780 - 0.9830 - ~23 sec.

我的环境是:

Python 3.5.2 -Anaconda / Windows 10
CUDA:8.0 与 cuDNN 5.1 Keras
1.2.1
Tensorflow 0.12.1
Nvidia Geforce GTX 860M

keras.json文件:

{
    "image_dim_ordering": "tf", 
    "epsilon": 1e-07, 
    "floatx": "float32", 
    "backend": "tensorflow"
}

你也可以复制并执行以下两个文件

https://github.com/emrahyigit/deep/blob/master/keras_cnn_mnist.py
https://github.com/emrahyigit/deep/blob/master/tf_cnn_mnist.py
https://github.com/emrahyigit/deep/blob/master/mnist.py
4

1 回答 1

5

问题是由于错误使用了 dropout 层的 keep_prob 参数,因为我应该在训练和测试过程中为这个参数提供不同的值。

于 2017-01-22T14:25:59.437 回答