0

我正在研究机器学习。在我学习的时候,我发现了使用 MNIST 数据集的 Tensorflow CNN 代码。这是我想知道的代码。

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y_conv), reduction_indices=[1]))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
sess.run(tf.global_variables_initializer())

for i in range(1000):
  batch = mnist.train.next_batch(100)
   if i%100 == 0:
     train_accuracy = accuracy.eval(feed_dict={
        x:batch[0], y_: batch[1], keep_prob: 1.0})
    print("step %d, training accuracy %g"%(i, train_accuracy))
  train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})

print("test accuracy %g"%accuracy.eval(feed_dict={
     x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))

在这段代码中,我的问题是关于 batch = mnist.train.next_batch(100)。当我对此进行搜索时,这意味着这是 mini-batch,并从 MNIST 数据集中随机选择 100 个数据。现在这是我的问题。

  1. 当我想用全批次测试这段代码时,我应该怎么做?只需将 mnist.train.next_batch(100) 更改为 mnist.train.next_batch(55000)?
4

1 回答 1

1

是的,获得一批 55000 将在 MNIST 的所有数字上训练一个 epoch。

请注意,这是一个坏主意:这可能不适合您的记忆。您必须保存 55000 位的权重激活和梯度……您的 Python 很可能会崩溃!

通过在一批 100 张随机图像上训练 1000 次,你会得到一个很好的结果,并且你的计算机很开心!

于 2017-03-16T08:43:10.640 回答