我正在尝试学习一些面部标志检测模型,并注意到其中许多使用 NME(归一化平均误差)作为性能指标:
该公式很简单,它计算地面实况点与模型预测结果之间的 l2 距离,然后将其除以归一化因子,该因子因不同的数据集而异。
但是,当在某人开发的某个地标检测器上采用此公式时,我必须处理这种不平凡的情况,即某些检测器可能无法为某些输入图像生成足够数量的地标(可能是因为继承了 NMS/模型问题/图像质量等)。因此,一些真实点可能在预测结果中没有对应的点。
那么如何解决这个问题,我是否应该将这样的缺失点结果添加到“失败结果集”并使用FR来测量模型,并在进行NME计算时忽略它们?