问题标签 [cupy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
chainer - Chainer 模块“cupy.cudnn”没有属性“softmax_forward”
我正在尝试通过 GPU 在chainer 上运行神经网络。但它似乎只是不工作。我已经尝试了某些版本的 cuda,9.0、10.1、10.0。在我遇到cupy安装问题之前。现在我只是通过 Anaconda 环境安装 cupy。cuda.to_gpu 和 cupy.array 似乎工作
我现在对这个问题一无所知。
错误说:
来自chainer.print_runtime_info() 的信息如下所示。
其次是@corochann 建议。我已经重新安装并更新了chainer,但现在我无法安装cupy。下面是chainer.print_runtime_info()。
当我尝试安装cupy。发生了这样的事情。
python - Chainer - Python - CUDA_ERROR_INVALID_SOURCE
我有一台带有两个不同 GPU(一个 RTX 和一个 Titan V)的机器,它经常无法运行任务。这种行为主要在 id=1 的 GPU 中观察到。
相同的任务可以在 id=0 的不同机器或 GPU 上成功运行。
精确的堆栈如下:
我的设置如下:
chainer 5.3 中也出现了同样的问题(我从头开始创建了一个新的 conda 环境)。
我相信这在某种程度上与多线程有关,但我找不到如何在 cupy 中将其关闭或如何完全避免该问题。
一些可能不相关的信息:这是一个相当随机的过程。在 GPU id=1 中,十分之八的情况下,它无法运行并出现上述错误。
有任何想法吗?
python - 在一堆矩阵上应用 cupy.linalg.svd
我想通过cupy.linalg.svd
一堆矩阵执行 SVD(奇异值分解),计算每个矩阵的 SVD。
这给出了一个错误,声称arr
不是 2D。显然,cp.linalg.svd
只能计算单个二维矩阵的 SVD。但是,numpy.linalg.svd
总是在数组的最后两个轴上计算 SVD,这要强大得多。
有没有一种方法可以有效地计算 SVD 中的一堆矩阵cupy
?
更好的是,有没有一种有效的通用方法apply_along_axis
?
chainer - CuDNN 在二进制安装的 cupy 中不可用
我使用二进制包安装了 Cupy cupy-cuda92
,但没有加载 CuDNN。
我尝试卸载并重新安装chainer和cupy,--no-cache-dir
但没有发现任何区别。我还确认 CUDA 是 9.2。
python - 如何使用cupy循环numpy ndarray?真的会提高执行时间吗?
我有两个大小相同的 numpy ndarray [512 X 512]。我想根据其他数组值更改一个数组。但是执行时间真的很长。所以,我想将 numpy ndarray 更改为 cupy ndarray 并希望在 GPU 中执行。可能吗?是否会缩短执行时间?这是我当前的一段代码。
python - Cupy 会自动使用 cuda 和 gpu 吗?
我知道对于允许将 python 与 GPU 一起使用的其他库,您必须指定您正在使用 cuda,否则这些函数将起作用但不能使用 cuda,例如 numba。Cupy 是否也是如此,还是它会自动使用 GPU?
raspberry-pi - 将 Raspberry 的 VideoCore IV GPU 用于链接器模型。需要cupy吗?库达?
我正在尝试在 Raspberry Pi 3 B+ 上运行Idein/chainer-pose-proposal-net 。这是 Chainer 中的姿态估计模型(特别是 Taiki Sekii 的 Pose Proposal Networks)。
在 README 中建议它可以使用 Raspberry 的 VideoCore IV GPU 来实现最高 10fps。我的问题是我不知道如何让它使用 GPU。必须安装什么?
我查看了CuPy,如果它安装了 Nvidia GPU 和 CUDA,这将是可行的方法。我找不到覆盆子的替代品。
我还查看了Actcast,但没有关于如何使用它的文档。
期望的结果是接近 10fps,但目前没有 GPU,我只能得到 ~0.4fps。
编辑 2019-05-28:
同时尝试了以下方法。不幸的是,我仍然无法达到所需的帧速率:
cupy - 有没有办法在调用之前编译(即缓存)cupy RawKernel?
我正在编写一个处理大量图像的 python 应用程序。应用程序的计算速度很重要,因此我试图通过编写 Cupy 内核来最小化执行时间。
为了简单起见,假设我在下面有一个cupy raw kernel。
在这里,'add_kernel' 只是简单地复制一个输入矩阵并将复制矩阵的每个元素添加一个然后返回它。它工作得很好,但我相信代码可以在执行速度方面进一步优化。
根据链接,第一次调用内核时(即不缓存),编译会有开销。
我想避免这个编译时间。所以想问问有没有办法在第一次调用内核之前编译cp.RawKernel?
提前致谢。
python - ValueError:具有多个元素的数组的真值不明确。使用 cupy 数组时使用 a.any() 或 a.all()
我有一个代码,我从Numpy repeat 获得的二维数组
下面的一个适用于 numpy 数组,但会抛出 ValueError:具有多个元素的数组的真值是不明确的。与 cupy 数组一起使用时使用 a.any() 或 a.all()。对于线路ret_val[mask] = cp.repeat(arr.ravel(), rep.ravel()
我尝试使用cupy中已经存在的逻辑操作,但它们仍然会抛出错误。
python-3.x - Google Colab 上没有名为“cupy”的模块
我正在研究 FastPhotoStyle 项目: https ://github.com/NVIDIA/FastPhotoStyle
我按照其教程的步骤操作: https ://github.com/NVIDIA/FastPhotoStyle/blob/master/TUTORIAL.md
我在默认环境为的 Google Colab 上运行示例 1
- CUDA 10.0
- 蟒蛇 3.6
- 链纳 5.4.0
- 铜皮 5.4.0
这是我在 Colab Notebook 上尝试的方式:
https://colab.research.google.com/drive/1oBgdJgXCLlUQhpwPoG1Uom3OKTzHR4BF
运行后
这是我收到的错误消息:
Traceback(最近一次调用最后一次):文件“demo.py”,第 9 行,在
导入 process_stylization
文件“/content/drive/FastPhotoStyle/process_stylization.py”,第 14 行,在
从平滑过滤器导入平滑过滤器
文件“/content/drive/FastPhotoStyle/smooth_filter.py”,第 327 行,在
从 cupy.cuda 导入函数
ModuleNotFoundError:没有名为“cupy”的模块
有人可以帮我吗?