问题标签 [cudnn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
theano - cudnn 无法安装
我正在使用 cuda 8.0 windows 10 GTX 770M 在theano上尝试LeNet5,似乎无法正确更新参数。当我导入 theano 时,我会得到这个错误:
我已通过将文件复制到“NVIDIA GPU Computing Toolkit\CUDA\v8.0”将 cudnn 5 安装到我的 cuda 8.0,但仍然显示相同的错误。
是不是因为theano不能编译cudnn,两者conv2d
都pool_2d
不能正常工作?结果我训练的时候错误率一直保持在90%左右。我是否正确安装了cudnn?我只是按照 theano 文档上的说明进行操作,但 zip 中没有 .so* 文件。
我已经尝试过 cpu 模式,它可以正确训练但真的很慢。
希望你们能帮助我摆脱困境,因为我被困了很多天。
非常感谢!
tensorflow - TensorFlow 未检测到 GPU
我在 ubuntu 16.04 上安装了 Cuda-8.0 和 Tensorflow GPU 版本。它最初工作正常并使用 GPU。但突然它停止使用 GPU。我通过 pip 安装了 tensorflow 并正确安装了 GPU 版本,因为它最初工作并使用了 GPU。
我在导入 tensorflow 时收到的消息是:
很明显,它甚至可以从 LD_LIBRARY_PATH 中找到 cuda 库。但是当我得到以下输出时:
所以它无法定位 GPU。nvidia-smi 给出以下输出:
我浏览了 stackoverflow 上的其他链接,但他们大多要求检查 LD_LIBRARY_PATH 或 nvidia-smi。对我来说,两者都是预期的,所以无法理解这个问题。
编辑:我尝试安装 cudnn 5 并将其也放入 LD_LIBRARY_PATH 中,tensorflow 成功读取它,但在创建会话时仍然出现相同的错误。
python - 运行 TensorFlow 时导入错误
我一直在尝试设置启用 GPU 的 Tensorflow 一段时间,但我被困在了这一点上。当我尝试将 tensorflow 导入我的程序时,出现以下错误:
ImportError:libcudnn.so.5:无法打开共享对象文件:没有这样的文件或目录
我已经检查了 /usr/local/cuda/lib64/ 并且确实有足够的 libcudnn.so.5 并且任何人都可以阅读,所以应该没问题。我正在使用 virtualenv 安装 Tensorflow,所以我想它可能正在其他地方寻找它,但我不知道它会在哪里寻找文件。任何人都知道问题可能是什么?
lstm - cuDNN RNN的使用
我将首先总结一下我对cuDNN 5.1 rnn 函数的理解:
张量维度
cudnnRNNForwardTraining / cudnnRNNForwardInference
cudnnRNNBackwardData
cudnnRNNBackwardWeights
问题:
- 以下多层 RNN ( num_layer > 1) 的训练工作流程是否正确?
- 初始化 hx,cx,dhy,dcy 为 NULL
- init w:(权重:小随机值,偏差:1)
- 向前
- 后向数据
- 后向权重
- 更新权重:w += dw
- dw = 0
- 转到 3。
- 当num_layer > 1时,您是否确认 cuDNN 已经实现了堆叠 rnn ?(无需调用num_layer次前进/后退方法)
- 我应该在下一批中将隐藏状态和单元状态重新注入网络吗?
- lstm/gru 公式的输出是hy。我应该使用hy作为输出还是y?
此处发布相同的问题(我将同步答案)
tensorflow - TensorFlow 未加载 cuDNN
我终于设法让 CUDA 在带有 Kesla T80 的 Microsoft Azure 服务器上工作。现在我需要让 cuDNN 工作,但 TensorFlow 不会加载它。
这是来自 TensorFlow 的消息:
所以我看到没有加载 cuDNN 库。
我有正确的文件/cuda-8.0/include/
和/cuda-8.0/lib64/
我的~/.bashrc
文件有正确的路径
编辑
更改.bashrc
为:
仍然没有运气。
来自 nvidia-smi 的输出:
我正在使用 tensorflow 版本 1.1.0、Ubuntu 16.04 和 CUDA 8.0。
编辑
所以我只是试图删除 cudnn 文件并加载 tensorflow,这给了我一个错误。一些东西找不到 libcuddn.so.5。所以我认为它会加载它,但我的印象是,如果使用 cuDNN,TensorFlow 会连同“libcuddn.so 加载成功”一起写一些东西。
tensorflow - 缺少 DLL 和 pywrap_tensorflow。TensorFlow-gpu 安装错误
我正在尝试在 anaconda 环境(python 3.5 版)中安装 tensorflow-gpu。但是,我遇到了一些错误,主要是:
- DLL 加载失败
- 没有名为“_pywrap_tensorflow_internal”的模块
似乎这个错误很常见,但是,我不确定为什么其他问题的解决方案不起作用。
- 我确实有一个
MSVCP140.DLL
在我的道路上。我通过where MSVCP140.DLL
. 这是此处建议的修复。 - 我从这里安装了 CUDA 8.0,从这里安装了cuDNN 5.1(而不是 cuDNN 6.0)。
- 我已将路径添加到
cudnn64_5.dll
(...\bin) - tensorflow 的 CPU 版本运行良好,没有错误。
我已经尝试重新安装 CUDA 和 tensorflow-gpu,但它仍然无法正常工作。有什么帮助吗?
错误信息:
tensorflow - 使用 GPU 而不是 CPU 与 Keras 和 Linux 的 Tensorflow 后端
我无法让 Keras 使用 GPU 版本的 Tensorflow 而不是 CPU。每次我导入 keras 时,它都会说:
...这意味着它正在工作,但在 CPU 上,而不是 GPU 上。我安装了 Cuda 和 cuDNN 并使用了这个环境:
我想我首先安装了 tensorflow 的 CPU 版本——我不记得了,因为我整天都在让 cuda 和 cudnn 工作。无论如何,我也安装了 GPU 版本:
它仍然给出相同的信息。我试图检查以下代码正在使用哪个设备:
但我得到这个输出,表明我正在使用设备 0,我的 GPU:
我真的无事可做。我唯一剩下的就是卸载 anaconda 并重新安装所有东西,我真的不想这样做,因为我真的花了一整天时间让它与 keras 和所有东西一起工作(只是还没有使用 GPU)
python-3.x - 安装tensorflow后导入错误
我尝试按照链接安装张量流中给出的安装张量流
我将它安装在虚拟环境中。我收到了编辑最后给出的导入错误。
我设置了以下环境变量。
此外,我还尝试手动复制 cudnn 的文件,但仍然没有运气。也就是说,我在两者中都有 libcudnn.so.5/usr/local/cuda/lib64
和/usr/local/cuda-8.0/lib64
.
正如其他相关帖子中所给出的,问题通常是由环境路径引起的,但我觉得它们在我的情况下是非常正确的,但仍然存在错误。
请帮忙!
编辑-这是完整的错误回溯-
tensorflow - 我一直在尝试使用 GPU 支持构建 tensorflow 大约一个星期,并且一直遇到安装问题
大约一周以来,我一直在尝试使用 GPU 支持构建 tensorflow,并且一直遇到 bazel 的安装问题。当然,我可以在这个过程之外运行我的 GPU。Windows 10 机器,cuda 8.0,cudnn 5.1
我相信这与我的环境变量没有指向正确的路径和/或在指向 usr/local/bin 文件夹而不是 C:\Program Files\ 的文件中引用的路径有关NVIDIA GPU 计算工具包\CUDA\v8.0
如果有人可以提供正确的路径,那将非常有帮助。另一个想法是我是否需要修改 bazel 配置文件来帮助解决这个问题? 这里的环境路径:
我的错误:
C:\Users\me\Anaconda3\envs\tensorflow_gpu\tensorflow>bazel build -c opt --copt=mavx tensorflow/examples/image_retraining:retrain 。错误:加载包'tensorflow/examples/image_retraining'时出错:读取扩展文件'cuda/build_defs.bzl'时遇到错误:没有这样的包'@local_config_cuda//cuda':回溯(最后一次调用):文件“C: /users/me/anaconda3/envs/tensorflow_gpu/tensorflow/third_party/gpus/cuda_configure.bzl”,第 915 行 _create_cuda_repository(repository_ctx) 文件“C:/users/me/anaconda3/envs/tensorflow_gpu/tensorflow/third_party/gpus/cuda_configure .bzl”,第 803 行,在 _create_cuda_repository _get_cuda_config(repository_ctx) 文件“C:
自动配置错误:找不到 cudnn 安装路径。. 信息:经过时间:21.262s
python - TensorFlow translate.py 教程有
查看代码块末尾的值错误。运行翻译教程时发生此错误。任何想法为什么这会破裂?我正在运行 python3 并正确安装了 CUDA 和 CuDNN。而且我能够根据安装说明验证 TensorFlow 的安装,因此 CuDNN/CUDA 的基本功能应该可以正常工作。我在 Ubuntu 16.04 上使用 python3。
最近使用翻译教程的其他人有这个问题吗?当我假设本教程适用于其他人时,你知道为什么我会遇到这个问题吗?