我用英特尔的 CVAT 注释了大约 15 分钟的视频。- https://github.com/opencv/cvat
导出到 TFRecord 时,文件只有 4mb 左右(至少应该接近 200mb),并且实际上似乎不包含任何图像数据。如何导出包含图像数据和注释数据的 TF 记录?
我用英特尔的 CVAT 注释了大约 15 分钟的视频。- https://github.com/opencv/cvat
导出到 TFRecord 时,文件只有 4mb 左右(至少应该接近 200mb),并且实际上似乎不包含任何图像数据。如何导出包含图像数据和注释数据的 TF 记录?
截至 2019 年 12 月 1 日 - 目前英特尔 CVAT 不支持此功能。
我能够实现我的目标,并创建包含注释数据和图像数据的 tfrecord,方法是使用组合ffmpeg
将我的原始文件拆分.mov
为帧和create_pascal_tf_record.py以生成 tfrecord。