我又看了一下vatic并让它工作。它是一种在线视频注释工具,旨在通过商业服务进行众包,并在 Linux 上运行。但是,也有离线模式。在这种模式下,不需要用于开发该软件的服务,并且该软件独立运行。
随附的 README 文件中对安装进行了详细描述。其中包括设置 appache 和 mysql 服务器、一些 python 包、ffmpeg。如果您遵循自述文件,这并不难。(我提到我的代理有一些问题,但这与这个软件包无关)。
您可以尝试在线演示。默认输出是这样的:
0 302 113 319 183 0 1 0 0 "person"
0 300 112 318 182 1 1 0 1 "person"
0 298 111 318 182 2 1 0 1 "person"
0 296 110 318 181 3 1 0 1 "person"
0 294 110 318 181 4 1 0 1 "person"
0 292 109 318 180 5 1 0 1 "person"
0 290 108 318 180 6 1 0 1 "person"
0 288 108 318 179 7 1 0 1 "person"
0 286 107 317 179 8 1 0 1 "person"
0 284 106 317 178 9 1 0 1 "person"
每行包含 10+ 列,以空格分隔。这些列的定义是:
1 Track ID. All rows with the same ID belong to the same path.
2 xmin. The top left x-coordinate of the bounding box.
3 ymin. The top left y-coordinate of the bounding box.
4 xmax. The bottom right x-coordinate of the bounding box.
5 ymax. The bottom right y-coordinate of the bounding box.
6 frame. The frame that this annotation represents.
7 lost. If 1, the annotation is outside of the view screen.
8 occluded. If 1, the annotation is occluded.
9 generated. If 1, the annotation was automatically interpolated.
10 label. The label for this annotation, enclosed in quotation marks.
11+ attributes. Each column after this is an attribute.
但也可以提供 xml、json、pickle、labelme 和 pascal voc 的输出
所以,总而言之,这完全符合我的要求,而且它也很容易使用。不过,我仍然对其他选择感兴趣!