问题标签 [cudnn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 为神经网络训练标记数据
有谁知道或有一个很好的工具来标记用于训练 DNN 的图像数据?
专门标记图像中的 2 个点,例如 upperLeftCorner 和 lowerRightCorner,然后计算指定对象周围的边界框。这只是一个例子,但我希望能够遵循 MSCoco 数据格式。
谢谢!
python - 使用 Fast/Faster-RCNN 在 C++ 上制作对象检测器的最简单方法是什么?
使用 Fast/Faster-RCNN 和 Caffe 在 C++ 上制作对象检测器的最简单方法是什么?
众所周知,我们可以在 Caffe 中使用 follow RCNN(基于区域的卷积神经网络):
scores, boxes = im_detect(net, im, obj_proposals)
这要求def im_detect(net, im, boxes):
为此使用rbgirshick/caffe-fast-rcnn, ROIPooling-layers 和输出bbox_pred
scores, boxes = im_detect(net, im)
这要求def im_detect(net, im, boxes=None):
为此使用rbgirshick/caffe-fast-rcnn, ROIPooling-layers 和输出bbox_pred
所有这些都使用 Python 和 Caffe,但是如何在 C++ 和 Caffe 上实现呢?
只有 C++ 示例用于分类(说明图像上的内容),但没有用于检测(说明图像上的内容和位置):https ://github.com/BVLC/caffe/tree/master/examples/cpp_classification
使用
rbgirshick/caffe-fast-rcnn简单地克隆rbgirshick/py-faster-rcnn存储库是否足够,下载预先保存的模型,使用这个coco/VGG16/faster_rcnn_end2end/test.prototxt并在CaffeNet C++ 分类中做了一个小改动例子?./data/scripts/fetch_faster_rcnn_models.sh
以及如何从bbox_pred和cls_score两层获取输出数据?
我会将所有 (bbox_pred & cls_score) 放在一个数组中吗:
还是在两个数组中?
python - 运行 TensorFlow 的 CudNN 错误:无法设置 cudnn 过滤器描述符:CUDNN_STATUS_BAD_PARAM
我在安装了 CUDA 7.5 并正常工作的 Ubuntu 系统上使用 Python 和 IDE Pycharm。
我刚刚将 CUDNN 文件与我的常规 CUDA 安装合并。
现在,当我从 TensorFlow 的网站运行深度卷积 nn 教程时,我收到以下错误:
F tensorflow/stream_executor/cuda/cuda_dnn.cc:383] 无法设置 cudnn 过滤器描述符:CUDNN_STATUS_BAD_PARAM
有谁知道这个问题的根源是什么?这是我的 CUDNN 安装的问题吗?(这太可怕了——我只是跑了rsync -av ./include/ /usr/local/cuda/include
,rsync -av ./lib64/ /usr/local/cuda/lib64
然后我重新跑了ldconfig /usr/local/cuda/lib64
)......或者代码中的错字?
或者它可能来自其他地方?(或者,更好的是,有人知道解决方法吗?)
tensorflow - TensorFlow GPU:cudnn 是可选的吗?无法打开 CUDA 库 libcudnn.so
我安装的是tensorflow-0.8.0 GPU版本,tensorflow-0.8.0-cp27-none-linux_x86_64.whl。它说它需要 CUDA 工具包 7.5 和 CuDNN v4。
但是,我不小心忘记安装 CuDNN v4,但除了错误消息“无法打开 CUDA 库 libcudnn.so”外,它工作正常。但它的工作原理是“创建 TensorFlow 设备 (/gpu:0)”。
没有 CuDNN 的味精
后来,我安装了 CuDNN,但我没有看到差异。
带有 CuDNN 的消息
那么有/没有CuDNN有什么区别?
gpu - 如何使用 Theano 启用 Keras 以利用多个 GPU
设置:
- 使用带有 Nvidia GPU 的 Amazon Linux 系统
- 我正在使用 Keras 1.0.1
- 运行 Theano v0.8.2 后端
- 使用 CUDA 和 CuDNN
- THEANO_FLAGS="设备=gpu,floatX=float32,lib.cnmem=1"
一切正常,但是当我增加批量大小以加快训练速度时,大型模型的视频内存不足。我认为迁移到 4 GPU 系统理论上会提高可用总内存或允许更小批量更快地构建,但观察 nvidia 统计数据,我可以看到默认情况下只使用一个 GPU:
我知道原始 Theano 可以显式手动使用多个 GPU。Keras 是否支持使用多个 GPU?如果是这样,它是否将其抽象化,或者您是否需要将 GPU 映射到 Theano 中的设备,并将计算显式编组到特定的 GPU?
cuda - TensorFlow 的 CUDA 安装。NVIDIA 没有适用于 CUDA 7.5 的 cuDNN v4
我正在尝试安装 CUDA(将其用于 TensorFlow)。建议使用 cuDNN v.4 和 CUDA 7.5。但是在https://developer.nvidia.com/rdp/cudnn-download
CUDA 7.0 只有 cuDNN v.4,CUDA 7.5 只有 cuDNN v.5(候选版本)。我在哪里可以获得 CUDA 7.5 的 cuDNN v.4?谢谢你。
c++ - 如何使用 NVIDIA cuDNN 计算“完整”卷积?
我正在针对简单问题测试 NVIDIA cuDNN 库。我正在尝试实现一些我认为很简单的事情,即进行“完整”卷积。我已经能够使用前向算法计算一个“有效”卷积而没有太多问题,但是我无法对“完整”卷积的后向算法做同样的事情。
我已经为我的输入、内核和卷积准备了张量,并尝试了:
我检查了所有 CUDA 调用的返回,我没有错误,但结果不是正确的“完整”卷积的结果。我正在将获得的结果与 matlab 的“完整”卷积进行比较。
我想这并没有达到我的预期。我应该尝试卷积BackwardFilter 算法吗?
如何使用 cudnn 执行“完整”卷积?
cudnn - cudnn 卷积滤波器的形状/顺序是什么?
Cudnn 将其过滤器存储在一个数组中。我知道数组的总大小必须是num_filters_out * num_filters_in * height_filter * width_filter
. 但实际上,数组是如何排序的?
是(num_filters_out, num_filters_in, height_filter, width_filter)
,还是不同的排列?(我根据 的签名猜到了cudnnSetFilter4dDescriptor
)
eclipse - 带有 Cuda 的 Tensorflow,libcudart.so.7.5:无法打开共享对象。日食(Liclipse)
当我在 Liclipse 中导入 tensorflow 时,出现以下错误:
我已经正确安装了 tensorflow 和 cuda,并且在终端上都可以正常工作。Tensorflow 是通过 pip 安装的,我使用的是 cuda 7.5 和 cuDNN v4,我使用的是 ubuntu 14.04。cuda 样本可以像 Liclipse 之外的 tensorflow 一样完美编译和运行。
我已将 cuda 添加到我的路径和 .bashrc 中的 LD_LIBRARY_PATH 中:
我将 Liclipse python 解释器设置为:/usr/bin/python-2.7
任何帮助将非常感激。