问题标签 [cudnn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ubuntu-16.04 - 即使指定了 5.1.10,Tensorflow 也可以使用 cuDNN 5.0 进行编译
我尝试自己编译 Tensorflow 以加快训练速度(使用预编译的轮子可以工作,但速度很慢)。我使用 ./configure 来配置并明确指定应使用 cuDNN 版本 5.1.10。在此之前,我下载了 cuDNN 5.1.10 并将我的文件复制到 Cuda 目录。
这是配置(.tf_configure.bazelrc)的样子:
注意 TF_CUDNN_VERSION="5.1.10" 部分。接下来我执行以下命令:
最后,我收到以下错误消息
到底是怎么回事?尽管我指定了正确的版本,但不知何故 Tensorflow 是使用 cuDNN 5.0 编译的?!
系统为 Ubuntu 16,AWS p2 实例。
compilation - theano 无法编译 cuda,但 python 代码使用 GPU 运行
我正在尝试在由 anaconda 创建的 python 虚拟环境中在 NVIDIA 1060 GPU 上使用 Cuda 8.0 在 Ubuntu 16.04 上运行 theano 简单代码。以下是我的 theanorc 文件:
我尝试运行的代码是 theano 网站上的一个简短示例:
当我运行代码时,我收到一堆警告和以下错误:
令人惊讶的是,代码运行并打印所需的输出如下:
我想知道我是否缺少 Theano 配置或其他东西?知道出了什么问题吗?
ps 除了安装在系统级别的 Cuda 库之外,所有库都已安装在我的 python 虚拟环境中。 - 谢谢
tensorflow - Tensorflow 未在 GPU 上运行
我已经花了相当多的时间在堆栈溢出上进行挖掘,并寻找答案,但找不到任何东西
大家好,
我在上面运行带有 Keras 的 Tensorflow。我 90% 确定我安装了 Tensorflow GPU,有没有办法检查我安装了哪个?
我试图从 Jupyter 笔记本上运行一些 CNN 模型,我注意到 Keras 正在 CPU 上运行模型(检查任务管理器,CPU 为 100%)。
我尝试从 tensorflow 网站运行此代码:
这就是我得到的:
对我来说,出于某种原因,这表明我正在我的 CPU 上运行。
我有一个 GTX1050(驱动程序版本 382.53),我安装了 CUDA、Cudnn 和 tensorflow,没有任何问题。我也安装了 Visual Studio 2015,因为它被列为兼容版本。
我记得 CUDA 提到安装了不兼容的驱动程序,但如果我没记错的话,CUDA 应该安装了自己的驱动程序。
编辑: 我运行这些命令来列出可用的设备
这就是我得到的
还有很多这样的警告
编辑 2
试过跑步
我得到
已解决: 查看评论以获取解决方案。感谢所有帮助过的人!
我是新手,所以非常感谢任何帮助!谢谢你。
ubuntu - tensorflow-gpu 和 cuDNN 未在 Ubuntu 16.04 上正确安装
我在华硕 K501UX 笔记本电脑上使用 NVidia Geforce GTX 950M(驱动程序 381)在 Ubuntu 16.04(x86_64)上安装了 CUDA 8.0。安装后CUDA
,我可以运行deviceQuery
and bandwidthTest
,根据this doc。
下载的 cuDNN 5.1 是一个.deb
包并自动安装。但是,没有cudnn.h
in /usr/local/cuda-8.0/include/
,也没有libcudnn
in/usr/lib/x86_64-linux-gnu/
目录。此验证表明 cuDNN 可能未正确安装。
TensorFlow-gpu 没有运行,所以要么 要么tensorflow
有cuDNN
问题。任何想法都值得赞赏。
windows - Windows 上不可预测的 CUDNN_STATUS_NOT_INITIALIZED
我在 Windows 10 上的 GTX 1070 上运行 keras 神经网络训练和预测。大多数时候它都在工作,但有时它会抱怨
它既不能用字面的错误含义来解释,也不能用 OOM 错误来解释。
怎么修?
tensorflow - 如何将cudnn5.1升级到cudnn6
我已经按照在 Windows 上安装 TensorFlow安装了 tensorflow-gpu ,当我导入 tensorflow 时它似乎运行良好,但是今天当我尝试一个新程序时,它显示了一些错误:
`
`
我知道这意味着我应该将我的 cudnn5.1 升级到 cudnn6,然后我下载 cudnn6 并将文件复制到我的 cuda 安装目录。然后在cudn/v8.0/bin目录下存在两个cudnn dll:cudnn64_5.dll和cudnn64_6.dll。
当我重新运行我的程序时,仍然出现同样的错误,当我删除 cudnn64_5.dll 时,我什至无法运行我的程序,出现一些新的错误:
`
`
我将我的cudnn64_6.dll重命名为cudnn64_5..dll,上面的错误消失了但仍然显示我的cudnn版本是5105。看来我必须做其他事情才能使cudnn升级工作,但我不知道。什么我应该怎么做才能解决错误?
tensorflow - 第一次 tf.session.run() 的执行与后来的运行截然不同。为什么?
这里有一个例子来说明我的意思:
First session.run():
First run of a TensorFlow session
later session.run():
TensorFlow session 的后续运行
我知道 TensorFlow 在这里进行了一些初始化,但我想知道它在源代码中的哪个位置。这发生在 CPU 和 GPU 上,但在 GPU 上效果更突出。例如,在显式 Conv2D 操作的情况下,第一次运行在 GPU 流中具有大量的 Conv2D 操作。事实上,如果我改变 Conv2D 的输入大小,它可以从几十到几百个流 Conv2D 操作。然而,在以后的运行中,GPU 流中始终只有五个 Conv2D 操作(无论输入大小如何)。在 CPU 上运行时,我们在第一次运行时保留了与以后运行相同的操作列表,但我们确实看到了相同的时间差异。
TensorFlow 源代码的哪一部分是造成这种行为的原因?GPU 操作在哪里“拆分”?
谢谢您的帮助!
tensorflow - 安装 TensorFlow-GPU 时出错
我正在尝试按照以下说明安装 tensorflow 和 tensorflow-gpu:
https://www.tensorflow.org/install/install_windows#CommonInstallationProblems
我想我正确地遵循了它们,但我似乎无法让它发挥作用。如果我以管理员身份从 CMD 提示符运行它,两者似乎都安装成功。如果我在安装 tensorflow 后停止,它会起作用。但是,一旦我也安装了 tensorflow-gpu(即使它似乎安装成功),当我尝试使用 tensorflow 时,就会出现错误。
这是我得到的错误:
我正在通过以管理员身份运行并激活运行的 CMD 提示符进行此安装。我也在 PyCharm 中尝试过类似的结果。
说明说即使我打算使用 tensorflow-gpu,我也应该安装常规的 tensorflow。
但是我尝试只安装 tensorflow-gpu,虽然安装说成功,但在运行“import tensorflow as tf”时仍然出现上述错误。
所以我似乎可以让它工作的唯一方法是如果我不安装 tensorflow-gpu。但是,我这样做的全部原因是我可以将我的 NVIDIA GPU 与 Keras/Tensorflow 结合使用。
注意:我确实安装了 CUDA Toolkit 8.0 和 cuDNN v5.1,虽然这个过程很混乱,所以我可能做错了什么。我认为没有简单的方法来验证它。
为了踢球,我尝试先安装 tensorflow-gpu,然后在仅安装 tensorflow 时出现以下错误——尽管是管理员,但出现权限错误:
这个问题是一个类似的问题: Tensorflow GPU installation Error Windows 10 Anaconda
但是,我确实确保我的路径指向正确的位置。
python - 大批量反向传播中的 CUDNN 错误
我实现了 MLP、RNN、CNN 的组合。批量大小为 420 时,一切似乎都运行良好(也就是我没有收到任何错误)。但是,一旦我将批次增加到 840,我就会收到以下错误:
向前传球似乎工作正常。我检查所有变量是否连续并且它们是连续的。此外,我对损失计算的预测和目标是连续的,而且返回的损失也是连续的。但是随后在调用时会发生此错误backward()
。任何想法为什么会发生这种情况?
CUDA 版本 8.0.61
Python 3.5.2
评论摘要:
- 一个序列中有 210 张图像,因此,我的批量大小为 210 步。每个图像的形状为
[3, 250, 250]
. - 我正在向后使用 PyTorch,我自己还没有实现任何向后的方法。
tensorflow - 更换gpu后是否必须重新安装tensorflow?
我正在使用带有 gpu 的 tensorflow。我的电脑有 NVIDIA gforce 750 ti,我将用 1080 ti 替换它。我是否必须重新安装 tensorflow(或其他驱动程序等)?如果是真的,我究竟需要重新安装什么?
还有一个问题,我可以通过在计算机上再安装一个 gpu 来加快训练过程吗?