我目前正在尝试运行一个名为 YOLO (darkflow)的对象检测器。
我已经安装了 CUDA 8.0、CudNN 5.1、tensorflow 1.0 和 tensorflow-gpu(均通过 pip 安装)。
我正在使用以下命令行测试 YOLO:
sudo python3 ./flow --model cfg/yolo.cfg --load yolo.weights --demo dji_0004.MP4 --gpu 1.0
问题是:即使使用 --gpu 1.0,它的运行速度约为 0.8 FPS。
在运行它时,我使用nvidia-smi来监控我的 GPU,这就是我得到的:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 375.82 Driver Version: 375.82 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 650 Off | 0000:01:00.0 N/A | N/A |
| 16% 40C P0 N/A / N/A | 444MiB / 980MiB | N/A Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 Not Supported |
+-----------------------------------------------------------------------------+
显然 tensorflow 没有在我的 GPU 上运行它。
GTX 650 根据 NVIDIA 的计算能力是 3.0,所以使用 tensorflow-gpu 应该没问题。