我正在尝试按照迁移学习、Jupyter notebook、教程对马的图像进行分类:
https://github.com/tensorflow/docs/blob/master/site/en/tutorials/images/transfer_learning.ipynb
我正在尝试在 Docker 中构建本地 Tensorflow 训练管道,并安装了最新的“TensorFlow Docker Image”。
我有 1000 张带标签的 JPG 图像,800x800,带有边界框和相关的 annotations.coco.json;分成训练/验证/测试文件夹。
通过使用“create_coco_tf_record.py”脚本将“annotations.coco.json”转换为 TFRecords,我设法将图像和标签部分加载到 TFRecordDatasets 中。
我正在努力了解如何转换/调整这些数据的大小以输入培训过程,特别是:
如何在转换/调整大小中使用“边界框”数据?本教程将整个输入图像的大小调整为 160x160,没有要处理的“边界框”数据。
例如,我应该剪掉包含在边界框内的图像,并调整它们的大小以输入到训练过程中吗?
与“边界框”相关联,每个图像可以有多个边界框,因此每个图像有多个标签;我们如何处理每张图像的这些“多个标签”?同样,本教程每张图片都有一个标签,因此在这方面更容易理解。
是否有更合适的教程来处理“边界框”和“每个图像的多个标签”?