0

我正在尝试按照迁移学习、Jupyter notebook、教程对马的图像进行分类:

https://github.com/tensorflow/docs/blob/master/site/en/tutorials/images/transfer_learning.ipynb

我正在尝试在 Docker 中构建本地 Tensorflow 训练管道,并安装了最新的“TensorFlow Docker Image”。

我有 1000 张带标签的 JPG 图像,800x800,带有边界框和相关的 annotations.coco.json;分成训练/验证/测试文件夹。

通过使用“create_coco_tf_record.py”脚本将“annotations.coco.json”转换为 TFRecords,我设法将图像和标签部分加载到 TFRecordDatasets 中。

我正在努力了解如何转换/调整这些数据的大小以输入培训过程,特别是:

  • 如何在转换/调整大小中使用“边界框”数据?本教程将整个输入图像的大小调整为 160x160,没有要处理的“边界框”数据。

  • 例如,我应该剪掉包含在边界框内的图像,并调整它们的大小以输入到训练过程中吗?

  • 与“边界框”相关联,每个图像可以有多个边界框,因此每个图像有多个标签;我们如何处理每张图像的这些“多个标签”?同样,本教程每张图片都有一个标签,因此在这方面更容易理解。

  • 是否有更合适的教程来处理“边界框”和“每个图像的多个标签”?

4

1 回答 1

0

我推荐这个 repo:https ://github.com/zzh8829/yolov3-tf2来尝试微调yolov3。它有一个完整的教程(https://github.com/zzh8829/yolov3-tf2/blob/master/docs/training_voc.md)关于如何重新训练这个yolov3对象检测器。它还支持“检测图像中的不同对象”(我认为=您的“每个图像有多个标签”)。希望这会让你继续前进,gl!

于 2020-12-15T10:53:29.753 回答