我训练 CaffeNet(更准确地说是用于两类分类的 Cifar10 模型)模型。现在模型已准备好进行检测。对于使用单个图像的模型测试,我使用test_predict_imagenet.cpp
. 我还没有测试代码对于 640 x 480 图像的运行速度有多快。我的目标是我喜欢 5~10 帧/秒对于离线检测来说很好。我知道我需要实现多尺寸检测(即,就像我们在人脸检测中所做的那样,原始图像尺寸会针对不同的较小尺寸重新调整大小),这样我就不会错过每一帧中的行人。
根据这篇论文,他们在训练中使用 64 x 128 的图像大小,检测需要 3 毫秒/窗口,对于 100 个窗口/图像,需要 300 毫秒/帧。不确定他们是否实施多尺寸检测方法。如果实现多尺寸,则需要更长的时间。
目前,我只了解test_predict_imagenet.cpp
多尺寸检测的实现方法。我知道它会很慢。有没有更有效的检测方法使用 CaffeNet 模型?我的目标非常适合 5~10 帧/秒的速率。谢谢