问题标签 [cudnn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1678 浏览

theano - cudnn 无法安装

我正在使用 cuda 8.0 windows 10 GTX 770M 在theano上尝试LeNet5,似乎无法正确更新参数。当我导入 theano 时,我会得到这个错误:

我已通过将文件复制到“NVIDIA GPU Computing Toolkit\CUDA\v8.0”将 cudnn 5 安装到我的 cuda 8.0,但仍然显示相同的错误。

是不是因为theano不能编译cudnn,两者conv2dpool_2d不能正常工作?结果我训练的时候错误率一直保持在90%左右。我是否正确安装了cudnn?我只是按照 theano 文档上的说明进行操作,但 zip 中没有 .so* 文件。

我已经尝试过 cpu 模式,它可以正确训练但真的很慢。

希望你们能帮助我摆脱困境,因为我被困了很多天。

非常感谢!

0 投票
1 回答
5061 浏览

tensorflow - TensorFlow 未检测到 GPU

我在 ubuntu 16.04 上安装了 Cuda-8.0 和 Tensorflow GPU 版本。它最初工作正常并使用 GPU。但突然它停止使用 GPU。我通过 pip 安装了 tensorflow 并正确安装了 GPU 版本,因为它最初工作并使用了 GPU。

我在导入 tensorflow 时收到的消息是:

很明显,它甚至可以从 LD_LIBRARY_PATH 中找到 cuda 库。但是当我得到以下输出时:

所以它无法定位 GPU。nvidia-smi 给出以下输出:

我浏览了 stackoverflow 上的其他链接,但他们大多要求检查 LD_LIBRARY_PATH 或 nvidia-smi。对我来说,两者都是预期的,所以无法理解这个问题。

编辑:我尝试安装 cudnn 5 并将其也放入 LD_LIBRARY_PATH 中,tensorflow 成功读取它,但在创建会话时仍然出现相同的错误。

0 投票
0 回答
96 浏览

python - 运行 TensorFlow 时导入错误

我一直在尝试设置启用 GPU 的 Tensorflow 一段时间,但我被困在了这一点上。当我尝试将 tensorflow 导入我的程序时,出现以下错误:

ImportError:libcudnn.so.5:无法打开共享对象文件:没有这样的文件或目录

我已经检查了 /usr/local/cuda/lib64/ 并且确实有足够的 libcudnn.so.5 并且任何人都可以阅读,所以应该没问题。我正在使用 virtualenv 安装 Tensorflow,所以我想它可能正在其他地方寻找它,但我不知道它会在哪里寻找文件。任何人都知道问题可能是什么?

0 投票
0 回答
1522 浏览

lstm - cuDNN RNN的使用

我将首先总结一下我cuDNN 5.1 rnn 函数的理解:

张量维度

cudnnRNNForwardTraining / cudnnRNNForwardInference

cudnnRNNBackwardData

cudnnRNNBackwardWeights


问题:

  1. 以下多层 RNN ( num_layer > 1) 的训练工作流程是否正确?
  1. 初始化 hx,cx,dhy,dcy 为 NULL
  2. init w:(权重:小随机值,偏差:1)
  3. 向前
  4. 后向数据
  5. 后向权重
  6. 更新权重:w += dw
  7. dw = 0
  8. 转到 3。
  1. 当num_layer > 1时,您是否确认 cuDNN 已经实现了堆叠 rnn ?(无需调用num_layer次前进/后退方法)
  2. 我应该在下一批中将隐藏状态和单元状态重新注入网络吗?
  3. lstm/gru 公式的输出是hy。我应该使用hy作为输出还是y

此处发布相同的问题(我将同步答案)

0 投票
0 回答
2105 浏览

tensorflow - TensorFlow 未加载 cuDNN

我终于设法让 CUDA 在带有 Kesla T80 的 Microsoft Azure 服务器上工作。现在我需要让 cuDNN 工作,但 TensorFlow 不会加载它。

这是来自 TensorFlow 的消息:

所以我看到没有加载 cuDNN 库。

我有正确的文件/cuda-8.0/include//cuda-8.0/lib64/

我的~/.bashrc文件有正确的路径

编辑 更改.bashrc为:

仍然没有运气。

来自 nvidia-smi 的输出:

我正在使用 tensorflow 版本 1.1.0、Ubuntu 16.04 和 CUDA 8.0。

编辑

所以我只是试图删除 cudnn 文件并加载 tensorflow,这给了我一个错误。一些东西找不到 libcuddn.so.5。所以我认为它会加载它,但我的印象是,如果使用 cuDNN,TensorFlow 会连同“libcuddn.so 加载成功”一起写一些东西。

0 投票
1 回答
1027 浏览

tensorflow - 缺少 DLL 和 pywrap_tensorflow。TensorFlow-gpu 安装错误

我正在尝试在 anaconda 环境(python 3.5 版)中安装 tensorflow-gpu。但是,我遇到了一些错误,主要是:

  • DLL 加载失败
  • 没有名为“_pywrap_tensorflow_internal”的模块

似乎这个错误很常见,但是,我不确定为什么其他问题的解决方案不起作用。

  1. 我确实有一个MSVCP140.DLL在我的道路上。我通过where MSVCP140.DLL. 这是此处建议的修复。
  2. 我从这里安装了 CUDA 8.0,从这里安装了cuDNN 5.1(而不是 cuDNN 6.0)。
  3. 我已将路径添加到cudnn64_5.dll(...\bin)
  4. tensorflow 的 CPU 版本运行良好,没有错误。

我已经尝试重新安装 CUDA 和 tensorflow-gpu,但它仍然无法正常工作。有什么帮助吗?


错误信息:

0 投票
3 回答
2173 浏览

tensorflow - 使用 GPU 而不是 CPU 与 Keras 和 Linux 的 Tensorflow 后端

我无法让 Keras 使用 GPU 版本的 Tensorflow 而不是 CPU。每次我导入 keras 时,它都会说:

...这意味着它正在工作,但在 CPU 上,而不是 GPU 上。我安装了 Cuda 和 cuDNN 并使用了这个环境:

我想我首先安装了 tensorflow 的 CPU 版本——我不记得了,因为我整天都在让 cuda 和 cudnn 工作。无论如何,我也安装了 GPU 版本:

它仍然给出相同的信息。我试图检查以下代码正在使用哪个设备:

但我得到这个输出,表明我正在使用设备 0,我的 GPU:

我真的无事可做。我唯一剩下的就是卸载 anaconda 并重新安装所有东西,我真的不想这样做,因为我真的花了一整天时间让它与 keras 和所有东西一起工作(只是还没有使用 GPU)

0 投票
1 回答
228 浏览

python-3.x - 安装tensorflow后导入错误

我尝试按照链接安装张量流中给出的安装张量流

我将它安装在虚拟环境中。我收到了编辑最后给出的导入错误。

我设置了以下环境变量。

此外,我还尝试手动复制 cudnn 的文件,但仍然没有运气。也就是说,我在两者中都有 libcudnn.so.5/usr/local/cuda/lib64/usr/local/cuda-8.0/lib64.

正如其他相关帖子中所给出的,问题通常是由环境路径引起的,但我觉得它们在我的情况下是非常正确的,但仍然存在错误。

请帮忙!

编辑-这是完整的错误回溯-

0 投票
2 回答
439 浏览

tensorflow - 我一直在尝试使用 GPU 支持构建 tensorflow 大约一个星期,并且一直遇到安装问题

大约一周以来,我一直在尝试使用 GPU 支持构建 tensorflow,并且一直遇到 bazel 的安装问题。当然,我可以在这个过程之外运行我的 GPU。Windows 10 机器,cuda 8.0,cudnn 5.1

我相信这与我的环境变量没有指向正确的路径和/或在指向 usr/local/bin 文件夹而不是 C:\Program Files\ 的文件中引用的路径有关NVIDIA GPU 计算工具包\CUDA\v8.0

如果有人可以提供正确的路径,那将非常有帮助。另一个想法是我是否需要修改 bazel 配置文件来帮助解决这个问题? 这里的环境路径:

我的错误:

C:\Users\me\Anaconda3\envs\tensorflow_gpu\tensorflow>bazel build -c opt --copt=mavx tensorflow/examples/image_retraining:retrain 。错误:加载包'tensorflow/examples/image_retraining'时出错:读取扩展文件'cuda/build_defs.bzl'时遇到错误:没有这样的包'@local_config_cuda//cuda':回溯(最后一次调用):文件“C: /users/me/anaconda3/envs/tensorflow_gpu/tensorflow/third_party/gpus/cuda_configure.bzl”,第 915 行 _create_cuda_repository(repository_ctx) 文件“C:/users/me/anaconda3/envs/tensorflow_gpu/tensorflow/third_party/gpus/cuda_configure .bzl”,第 803 行,在 _create_cuda_repository _get_cuda_config(repository_ctx) 文件“C:

自动配置错误:找不到 cudnn 安装路径。. 信息:经过时间:21.262s

0 投票
1 回答
445 浏览

python - TensorFlow translate.py 教程有

查看代码块末尾的值错误。运行翻译教程时发生此错误。任何想法为什么这会破裂?我正在运行 python3 并正确安装了 CUDA 和 CuDNN。而且我能够根据安装说明验证 TensorFlow 的安装,因此 CuDNN/CUDA 的基本功能应该可以正常工作。我在 Ubuntu 16.04 上使用 python3。

最近使用翻译教程的其他人有这个问题吗?当我假设本教程适用于其他人时,你知道为什么我会遇到这个问题吗?