有没有人找到稳定访问 GPU 运行时的方法?
目前我遵循这个过程:
Runtime -> Change runtime type -> "Python 2" and "GPU" -> Save -> Runtime -> Connec to runtime...
并检查是否启用了 GPU:
import tensorflow as tf
tf.test.gpu_device_name()
但是,我得到''
了,尽管 30 次中有 1 次我能够连接。有谁知道发生了什么?
有没有人找到稳定访问 GPU 运行时的方法?
目前我遵循这个过程:
Runtime -> Change runtime type -> "Python 2" and "GPU" -> Save -> Runtime -> Connec to runtime...
并检查是否启用了 GPU:
import tensorflow as tf
tf.test.gpu_device_name()
但是,我得到''
了,尽管 30 次中有 1 次我能够连接。有谁知道发生了什么?
权威地知道你连接的是哪种运行时的方法是将鼠标悬停在右上角的 CONNECTED 按钮上;如果悬停工具提示后缀为“(GPU)”,那么您就有了 GPU。
您可以通过检查执行的输出来测试 GPU 硬件的运行状况!/opt/bin/nvidia-smi
(顺便说一下,这只能在 GPU 运行时找到)。
Tensorflow 无法看到 GPU 而nvidia-smi
can 通常是做了以下事情的症状:
!pip install -U tensorflow
这会让你得到一个不知道如何与 GPU 对话的 TF 构建。所有 colaboratory 运行时都已经预安装了 TF,因此您不需要重新安装它。如果您需要预装版本中没有的 TF 特定功能,您可以获得知道如何与 GPU 通信的构建,!pip install -U tensorflow-gpu
但请注意,预安装的 TF 构建针对特定 CPU 平台进行了更好的优化使用,因此您将放弃一些性能,并使用更多的 RAM。
如果由于!pip install -U
依赖于 tensorflow 的其他内容而仅重新安装了 TF 构建,则可以通过指定--upgrade-strategy=only-if-needed
哪个应该保留预安装的 TF 来避免这种情况。
如果你搞砸了你的运行时间并且想彻底清除,执行
kill -9 -1
并等待 15-30 秒重新连接。