0

我正在自定义数据集上训练 yolo5,但由于它只使用 8 个 GPU 中的一个,所以我一直在用完 GPU 的内存。我应该如何运行它才能使用所有 GPU?

YOLOv5 v4.0-83-gd2e754b 火炬 1.7.1 CUDA:0 (Tesla K80, 11441.1875MB) CUDA:1 (Tesla K80, 11441.1875MB) CUDA:2 (Tesla K80, 11441.1875MB) CUDA:3 (Tesla K80, 114841. MB) CUDA:4 (Tesla K80, 11441.1875MB) CUDA:5 (Tesla K80, 11441.1875MB) CUDA:6 (Tesla K80, 11441.1875MB) CUDA:7 (Tesla K80, 11441.1875MB)

运行时错误:CUDA 内存不足。尝试分配 16.00 MiB(GPU 0;11.17 GiB 总容量;10.66 GiB 已分配;2.31 MiB 空闲;PyTorch 总共保留 10.72 GiB

谢谢 Ganesh

4

1 回答 1

0

在https://github.com/ultralytics/yolov5/issues/475找到了答案。

该链接包含有关如何使用 PyTorch 和 yolo5 运行 DataParallel 和 Distributed 的所有详细信息

于 2021-02-21T08:35:32.163 回答