2

我正在尝试将 SUN RGB-D 数据集导入 lmdb 格式,以便 caffe 可以训练边界框回归。我看到对于 imagenet 转换,有一个文件将文件名和类标签放在一行上。如何准备数据以便可以通过四点坐标标记对象?在地面实况图像中识别出大约 10 个对象,因此一张图像应该包含大约 10 * 8 个回归结果的值。

4

0 回答 0