0

我试图在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明: https ://github.com/tensorflow/models/tree/master/inception#how-to -构建一个新的数据集进行再训练

如教程中所述,我使用bazel成功构建并运行了build_image_data 。之后我使用bazel成功构建了inception_train

~/tensorflowmodels/models/inception# bazel build inception/inception_train
INFO: Found 1 target...
Target //inception:inception_train up-to-date (nothing to build)
INFO: Elapsed time: 0.073s, Critical Path: 0.00s

但是,运行 bazel-bin/inception/inception_train 我总是得到以下信息:

~/tensorflowmodels/models/inception# bazel-bin/inception/inception_train   --train_dir="/"   --validation_dir="/"   --data_dir="/images_jpg/"   --pretrained_model_checkpoint_path="/tensorflowmodels/models/inception/inception-v3/"   --fine_tune=True   --initial_learning_rate=0.001   --input_queue_memory_factor=1   --num_gpus=1
-bash: bazel-bin/inception/inception_train: No such file or directory

当然,我会说它有 99.9999% 的机会是错字。于是我尝试用 python 运行 inception_train.py。我不得不更改一些导入位置,最后它使用参数运行。但是,在初始化 CUDA 驱动程序后,脚本会停止并且没有任何错误消息。

任何有关如何解决此问题(或执行微调/重新训练)的帮助将不胜感激。

  • 张量流版本:0.9rc0
  • CPU : Xeon 5, 24 核
  • GPU:网格 K2 8 GB
  • 操作系统:Ubuntu 14.04

顺便说一句,我已经将此作为 Github 问题发布(已关闭,因为它更像是 Stack Overflow 的一个案例)。

4

0 回答 0