在 EC2 p2.xlarge 实例上运行启用 GPU 的 docker 容器时,我在容器开始运行之前遇到了 30 到 90 秒的延迟。后续容器快速启动(延迟 1 秒)。
EC2 运行 ubuntu 18.04,NVIDIA 驱动程序版本 396.54 和 nvidia-docker2(遵循官方安装指南:https ://github.com/NVIDIA/nvidia-docker )
我正在使用最新的官方 CUDA 映像进行测试: docker run --rm nvidia/cuda nvidia-smi
我的机器上启用了持久模式。如https://github.com/NVIDIA/nvidia-docker/wiki/Frequently-Asked-Questions#how-do-i-install-the-nvidia-driver中所述, “为什么我的容器从 2.0 开始很慢? " 它应该是解决方案,但对我不起作用。
任何可能导致延迟以及如何解决它的想法都值得赞赏。