我正在尝试 vlfeat,从图像数据库中获取大量特征,并且我正在使用基本事实测试平均精度 (MAp)。总的来说,我得到了大约 40%。我看到一些论文得到了更高的 MAp,同时使用了与我非常相似的技术;标准的词袋。
我目前正在寻找为标准词袋技术获得更高 MAp 的答案。虽然我看到还有其他实现,例如 SURF 等等,但让我们在这个问题中坚持标准的 Lowe's SIFT 和标准的词袋。
所以事情是这样的,我看到 vl_sift 得到了阈值,让你对特征选择更加严格。目前,我知道追求更高的阈值可能会使您获得更小、更有意义的“好”功能列表,并可能减少一些嘈杂的功能。“好”特征意味着,给定具有不同变化的相同图像,在其他图像上也会检测到非常相似的特征。
但是,我们应该为这个阈值设置多高?有时,我看到图像根本没有返回具有更高阈值的特征。起初,我想继续调整阈值,直到我得到更好的 MAp。但同样,我认为继续调整只是为了找到各自数据库的最佳 MAp 是一个坏主意。所以我的问题是:
虽然调整阈值可能会减少特征数量,但增加阈值是否总是会返回更少但更好的特征?
有没有更好的方法来获得好的特征?
还有哪些其他因素可以提高获得良好特征的速度?