0

目前,我正在实施一个系统,该系统可以计算在地铁站穿越感兴趣线路的乘客人数。为了衡量分割算法的质量,我在地铁站的天花板上安装了一个摄像机,并录制了一段 13 秒的视频。

13 秒的视频包含 412 帧。

以下是我的问题:

  1. 要获得 TPR(真阳性率),需要手动分析帧,即检查 412 帧中的每一帧并计算正确标记的次数?而FPR,是否只算“误报”?

  2. 要测试每种算法,我应该使用校正过滤器吗?或者只是分析它们的原始形式(没有过滤器)?

  3. 当您越界或跨屏幕扩展时检测到这些费率?

这是412帧的一部分

我请求您帮助解决这个问题。

4

2 回答 2

1

每次有人越线时,您肯定必须手动标记。这部分对于能够正确评估您的算法至关重要。

我建议您创建一个groundtruth 文件,其中列出有人越线时的所有帧索引。您的算法输出应该是相同的类型 - 它检测到线交叉的帧索引(如果您使用分段或其他技术,它不应该影响评估过程)。

您应该做的最后一件事是定义匹配标准:如果在 frame_i 中存在真正的线交叉并且您的算法检测到在 frame_j 中的交叉,那么如果 abs(frame_i-frame_j) < 阈值,它将被视为真阳性,否则这将被视为误报。

于 2016-09-28T06:22:53.780 回答
0

TP、TN、FP、FN 用于衡量地面实况图像与系统输出之间的比较质量。在您的项目中,您需要比较通过您的程序越线和计算机的人数。

于 2016-09-26T07:42:40.463 回答