我正在使用这段代码(请原谅它的混乱)在我的 CPU 上运行。我有一个我自己创建的自定义 RL 环境,我正在使用 DQN 代理。
但是当我在 GPU 上运行这段代码时,它并没有使用太多,实际上它比我的 CPU 慢。
这是 的输出nvidia-smi
。如您所见,我的进程正在 GPU 上运行,但速度比我预期的要慢得多。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.82 Driver Version: 440.82 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 TITAN Xp Off | 00000000:00:05.0 Off | N/A |
| 23% 37C P2 60W / 250W | 11619MiB / 12196MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 TITAN Xp Off | 00000000:00:06.0 Off | N/A |
| 23% 29C P8 9W / 250W | 157MiB / 12196MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 25540 C python3 11609MiB |
| 1 25540 C python3 147MiB |
+-----------------------------------------------------------------------------+
谁能指出我可以做些什么来更改我的 GPU 功能代码?
PS:请注意,我有两个 GPU,并且我的进程都在它们上运行。即使我使用两个 GPU 中的任何一个,问题是我的 GPU 没有被使用并且速度比 GPU 相对慢,所以两个 GPU 不是问题