我了解 TensorFlow 支持分布式训练。
我找到num_clones
了,train_image_classifier.py
这样我就可以在本地使用多个 GPU。
python $TF_MODEL_HOME/slim/train_image_classifier.py \
--num_clones=2
--train_dir=${TRAIN_DIR} \
--dataset_name=imagenet \
--dataset_split_name=train \
--dataset_dir=${DATASET_DIR} \
--model_name=vgg_19 \
--batch_size=32 \
--max_number_of_steps=100
如何在不同主机上使用多个 GPU?