0

我正在尝试学习一些面部标志检测模型,并注意到其中许多使用 NME(归一化平均误差)作为性能指标:

在此处输入图像描述

该公式很简单,它计算地面实况点与模型预测结果之间的 l2 距离,然后将其除以归一化因子,该因子因不同的数据集而异。

但是,当在某人开发的某个地标检测器上采用此公式时,我必须处理这种不平凡的情况,即某些检测器可能无法为某些输入图像生成足够数量的地标(可能是因为继承了 NMS/模型问题/图像质量等)。因此,一些真实点可能在预测结果中没有对应的点。

那么如何解决这个问题,我是否应该将这样的缺失点结果添加到“失败结果集”并使用FR来测量模型,并在进行NME计算时忽略它们?

4

1 回答 1

0

如果您有作为神经网络的输出的向量 10x1 作为示例,那就是您的点,例如 [x1,y1,x2,y2...x5,y5]。该向量将是模型中神经元数量的固定长度原因。如果您缺少点 - 这是因为(例如,您有 5 个点中的 4 个)有些点超出了图像的宽度和高度。或者像 [-0.1, -0.2, 0.5,0.7 ...] 这样的减号(负),前 2 个点在图像上看不到,就像它们是任务一样,但它们将在矢量中,你可以调用 NME。在一些可能的自定义神经网络中,因为缺失值将被更改为最大的错误点。

于 2021-09-13T06:34:28.913 回答