我试图在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明: https ://github.com/tensorflow/models/tree/master/inception#how-to -构建一个新的数据集进行再训练
如教程中所述,我使用bazel成功构建并运行了build_image_data 。之后我使用bazel成功构建了inception_train:
~/tensorflowmodels/models/inception# bazel build inception/inception_train
INFO: Found 1 target...
Target //inception:inception_train up-to-date (nothing to build)
INFO: Elapsed time: 0.073s, Critical Path: 0.00s
但是,运行 bazel-bin/inception/inception_train 我总是得到以下信息:
~/tensorflowmodels/models/inception# bazel-bin/inception/inception_train --train_dir="/" --validation_dir="/" --data_dir="/images_jpg/" --pretrained_model_checkpoint_path="/tensorflowmodels/models/inception/inception-v3/" --fine_tune=True --initial_learning_rate=0.001 --input_queue_memory_factor=1 --num_gpus=1
-bash: bazel-bin/inception/inception_train: No such file or directory
当然,我会说它有 99.9999% 的机会是错字。于是我尝试用 python 运行 inception_train.py。我不得不更改一些导入位置,最后它使用参数运行。但是,在初始化 CUDA 驱动程序后,脚本会停止并且没有任何错误消息。
任何有关如何解决此问题(或执行微调/重新训练)的帮助将不胜感激。
- 张量流版本:0.9rc0
- CPU : Xeon 5, 24 核
- GPU:网格 K2 8 GB
- 操作系统:Ubuntu 14.04
顺便说一句,我已经将此作为 Github 问题发布(已关闭,因为它更像是 Stack Overflow 的一个案例)。