我是深度学习的新手,我正在尝试训练我的 SSD-300(单次检测器)模型,这需要太长时间。例如,即使我跑了 50 个 epoch,它也在训练 108370+ 全局步骤。我正在使用来自官方 github 存储库的默认 train_ssd_network.py 文件:https ://github.com/balancap/SSD-Tensorflow
我为训练运行的命令:
!python train_ssd_network.py --dataset_name=pascalvoc_2007 epochs= 50 --dataset_split_name=train --model_name=ssd_300_vgg --save_summaries_secs=60 --save_interval_secs=600 --weight_decay=0.0005 --optimizer=adam --learning_rate=0.001 --batch_size=6 --gpu_memory_fraction=0.9 --checkpoint_exclude_scopes =ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg/block10_box,ssd_300_vgg/block11_box
如何更改训练步骤以及理想的训练步骤是什么?
train_ssd_network.py 没有提供与 global_steps 相关的具体数字