这是另一篇文章中未解决的部分。我正在尝试提交一个谷歌云作业,用于训练 mnist 数字的 cnn 模型。
这是我的系统。windows 10、anaconda、jupyter notebook 6、python 3.6、tf 1.13.0。
我对本地火车使用 gcloud 命令。第二个单元格似乎卡在 [*] 状态并且什么都不显示,直到我关闭并停止 ipynb 文件。培训随即开始,结果是正确的,因为我在 Tensorboard 上对其进行了监控。
我可以让它在没有这个问题的终端中运行。我也成功地将作业提交到云端并成功完成。
有没有想过当地的火车问题?代码在这里。
OUTDIR='trained_test'
INPDIR='..\data'
shutil.rmtree(path = OUTDIR, ignore_errors = True)
!gcloud ai-platform local train \
--module-name=trainer.task \
--package-path=trainer \
-- \
--output_dir=$OUTDIR \
--input_dir=$INPDIR \
--epochs=2 \
--learning_rate=0.001 \
--batch_size=100