我想在我的本地 GPU 服务器上的 imagenet2012 数据集上训练一个 resnet50 模型,完全遵循这个 Tensorflow 官方页面:https ://github.com/tensorflow/models/tree/master/official/vision/image_classification#imagenet-preparation 但是,我不知道如何准备 imagenet2012 训练和验证数据集,以便我可以像这样开始训练:
python3 classifier_trainer.py \
--mode=train_and_eval \
--model_type=resnet \
--dataset=imagenet \
--model_dir=$MODEL_DIR \
--data_dir=$DATA_DIR ??? \ # ----------> HOW TO CONFIG THIS DIR IF I HAVE DOWNLOADED THE DATA??
--config_file=configs/examples/resnet/imagenet/gpu.yaml \
--params_override='runtime.num_gpus=$NUM_GPUS'
具体来说,我已将数据集下载为两个 tar 文件:ILSVRC2012_img_train.tar
,ILSVRC2012_img_val.tar
到\myPath
目录,按照说明:https ://github.com/tensorflow/datasets/blob/master/docs/catalog/imagenet2012.md#imagenet2012
谁能告诉我准备数据集和设置配置的确切步骤(通过命令行参数或在 configs/examples/resnet/imagenet/gpu.yaml 中设置)。
PS1,我注意到训练脚本可以使用两种类型的数据集:1)使用 TFDS 2)使用 TFRecords。我已经使用页面底部的 shell 脚本创建了 TFRecords 数据集,但仍然不知道如何设置配置。TFDS似乎是TF推荐的,但只要我能成功运行培训,我就可以接受TFRecords格式。目前,我已经有以下形式的训练和验证 TFRecords 文件:
${DATA_DIR}/train/train-00000-of-01024
${DATA_DIR}/train/train-00001-of-01024
...
${DATA_DIR}/train/train-01023-of-01024
${DATA_DIR}/validation/validation-00000-of-00128
S{DATA_DIR}/validation/validation-00001-of-00128
...
${DATA_DIR}/validation/validation-00127-of-00128
PS2:希望 TF 社区可以为像我这样的初学者提供一个清晰的逐步准备 imagenet 数据集的指南。将不胜感激!