我正在尝试使用 cvlib 包,它使用 yolov3 模型来识别 Windows 10 上图像上的对象。让我们举一个简单的例子:
import cvlib as cv
import time
from cvlib.object_detection import draw_bbox
inittimer=time.time()
bbox, label, conf = cv.detect_common_objects(img,confidence=0.5,model='yolov3-worker',enable_gpu=True)
print('The process tooks %.3f s'%(time.time()-inittimer)
output_image = draw_bbox(img, bbox, label, conf)
结果给出~60ms。
cvlib 使用 opencv 来计算这个 cnn 部分。
如果现在我尝试查看使用了多少 GPU tensorflow,使用子进程,它只需要 824MiB。
当程序运行时,如果我启动 nvidia-smi 它会给我这个结果:
如您所见,这里有更多可用内存。我的问题很简单.. 为什么 Cvlib(以及 tensorflow)不使用所有这些来改进时间检测?
编辑:
据我了解,cvlib 使用 tensorflow,但它也使用 opencv 检测器。我使用 cmake 和 Cuda 10.2 安装了 opencv 我不明白为什么,但在 nvidia-smi 中它写的是 CUDA Version : 11.0 不是。也许这就是问题的一部分?

