问题标签 [cupy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
251 浏览

python - UnicodeDecodeError 当我使用 cuda 训练数据集时

我用chainer训练了一些图像,但出现了错误。

我不知道是它的UnicodeDecodeError 还是安装cupy 的错误。

0 投票
1 回答
536 浏览

cython - Cupy 会支持 cython(例如缓冲索引)吗?

我已经实现了自己定义的链接器链接,但是因为它太慢了。我已经实现了我的代码的 cython CPU 版本。但我想通过 GPU 进一步提高速度。所以我测试了以下代码,但它失败了:

报告:

0 投票
1 回答
2221 浏览

python - 使用 cupy 进行异步 GPU 内存传输

cupy是否可以使用(或)从/向 GPU 异步传输内存chainer

我正在训练一个相对较小的网络,其中包含不适合 GPU 内存的大量数据。此数据应保存在 CPU 内存中,并按顺序提供给 GPU 进行小批量计算。

内存传输时间是这个应用程序的主要瓶颈。我认为异步内存传输解决了这个问题,即在计算一个 minibatch 的过程中,另一个 minibatch 在后台传输到 GPU。

我想知道cupy.cuda.Stream上课是否可行,但我还不知道。我将不胜感激任何意见/建议。

编辑:我认为以下代码会进行异步内存传输,但不是。

nvvp 显示内存传输是按顺序进行的。

0 投票
2 回答
7256 浏览

cuda - 可以在google colab上安装cupy吗?

我正在尝试在 google colab 上使用 GPU 运行 chainer。这需要安装cupy,但是我无法正确安装它,因为它在我的colab vm中找不到cuda环境。

错误信息如下...

收集 cupy 下载 cupy-2.4.0.tar.gz (1.7MB) 100% |███████████████████████████████ █| 1.7MB 740kB/s 命令 python setup.py egg_info 的完整输出:cc1plus:警告:命令行选项“-Wstrict-prototypes”对 C/ObjC 有效,但对 C++/tmp/tmpds3ikncy/a.cpp:1:10 无效:致命错误:cublas_v2.h:没有这样的文件或目录#include ^~~~~~~~~~~~~编译终止。选项:{'profile': False, 'linetrace': False, 'annotate': False, 'no_cuda': False} *********************** ****************************** * 警告:nvcc 不在路径中。*警告:请将路径设置为 nvcc。******************************************************包含目录:[] 库目录:[] 命令“x86_64-linux-gnu-gcc”失败,退出状态为 1 ************************* ************************* * 警告:未找到包含文件:['cublas_v2.h', 'cuda.h', 'cuda_profiler_api.h '、'cuda_runtime.h'、'curand.h'、'cusparse.h'、'nvrtc.h'、'nvToolsExt.h'] *警告:跳过安装 cuda 支持 *** 警告:检查您的 CFLAGS 环境变量 ************************************ ****************** Traceback(最近一次调用最后):文件“”,第 1 行,在文件“/tmp/pip-build-qu5red9h/cupy/setup.py”中,第 32 行,在 ext_modules = cupy_setup_build.get_ext_modules() 文件“/tmp/pip-build-qu5red9h/cupy/cupy_setup_build.py”,第 385 行,在 get_ext_modules extensions = make_extensions(arg_options, compiler, use_cython) 文件“/tmp/pip -build-qu5red9h/cupy/cupy_setup_build.py", line 275, in make_extensions raise Exception('Your CUDA environment is invalid.' Exception: Your CUDA environment is invalid. 请检查上面的错误日志。

命令“python setup.py egg_info”失败,错误代码 1 在 /tmp/pip-build-qu5red9h/cupy/

0 投票
1 回答
1159 浏览

python - 如何将GitHub中包的不同分支(基于python)导入本地计算机?

我有一个关于在 Google Colab 上导入不同分支的问题。

Autograd(https://github.com/HIPS/autograd)有一个可适应cupy的版本,它位于另一个分支(https://github.com/HIPS/autograd/tree/cupy )。我想导入autograd(cupy - 友好的版本进入谷歌 colab 并使用以下命令:

但它有以下错误:

收集 git+git://github.com/ericmjl/autograd/tree/cupy
克隆 git://github.com/ericmjl/autograd/tree/cupy 到 /tmp/pip-yoasr9_z-build 致命:

远程错误:ericmjl/autograd/tree/cupy 不是有效的存储库名称
电子邮件 support@github.com 寻求帮助

命令“git clone -q git://github.com/ericmjl/autograd/tree/cupy /tmp/pip-yoasr9_z-build”失败,错误代码为 128,无

有没有人可以帮助我?非常感谢!!

0 投票
1 回答
670 浏览

python - 用cupy增加内环距离函数

我试图在迭代内部循环数组时提高给定距离函数的计算速度 - c(x, y)。我试图使用带有随机值的 cupy 和基准测试。到目前为止,我有以下代码:

但是,与 CPU 相比,GPU 时间似乎要高得多。

在考虑使用 CUDA 提高计算速度背后的理论时,我是否缺少任何重要的提示或问题?

0 投票
3 回答
4662 浏览

python-2.7 - 无法使用chainer 4.1.0导入cupy

我在 python2.7.11 中有一个使用chainer 和cupy 的项目。将 Chainer 版本从 1.22 更新到 4.1.0 后,我无法使用 cupy

这是我安装chainer1.22的方式。无需安装cupy即可成功导入cupy。

查看

我可以看到 CUDA 可用于chainer1.22

所以我卸载了chainer 1.22

安装chainer 4.1.0

结果是

可以看到 cuda 不适用于 chainer 版本 4.1.0。所以我尝试用 pip 安装 cupy

安装时记录

无法构建 cupy 我检查了 nvcc 版本

当我尝试在chainer1.22环境下通过pip安装cupy时,也会出现同样的问题

这是我的环境

我引用了这篇文章 ,但它对我不起作用。

如何使用 CHAINER4.1.0 导入 CUPY?

感谢您阅读我的问题!

0 投票
2 回答
4350 浏览

python - Cupy 比 numpy 慢

我试图用cupy而不是numpy来加速我的python代码。这里的问题是,使用 cupy,我的代码变得非常慢。也许我在这个问题上有点天真。

也许任何人都可以在我的代码中找到瓶颈:

编辑 我试图对我的代码进行基准测试,这里有一些结果,它们可以被视为代码中的注释。每个数字保留一行。单位是秒。n:Numpy,c:CuPy,我主要是粗略估计一下顺序。额外的我测试

0 投票
2 回答
366 浏览

tensorflow - 用cupy求解矩形稀疏线性方程组

我正在尝试使用cupy解决稀疏特征的矩形系统。我知道内置函数sparse.linalg.lsqr(A, b)是为 square matrix 做的A。但是我喜欢解决一个矩形稀疏系统。这是我们可以解决平方系统的方法:

它给出了矩形系统的尺寸不匹配错误,我找不到与 eg 等效的内置稀疏方法cupy.tensorsolve()

顺便说一句,有没有办法用 Tensorflow 做到这一点?谢谢你的帮助。我正在使用谷歌 Colaboratory 笔记本。

0 投票
0 回答
92 浏览

python - 如何使用 `cupy` 库对标量进行快速按位运算

我正在 GPU 上构建强化学习模型,所以我使用的是具有Cupy后端 的chainer 。除了它在 GPU 上运行之外,它 的目的是复制。cupynumpy

我之前问过这个问题,关于如何对 in 中的标量进行快速位移numpy,答案很简单:我需要对实际numpy.uint64对象而不是对象进行位移numpy.array。如果我可以将我的位移方法转移到cupy以获得相同的加速,那就太好了。

但是,cupy文档要求标量在 GPU 而不是 CPU 上(来源)。这意味着要么我...

  1. 将我的标量表示为一个数组,这在上面的链接问题中提出了我的原始问题,或者
  2. 将我的标量整数推送到 CPU,进行计算,然后将其推送回 GPU,这也很慢。

如果我想对一个标量值进行数十万次位移,虽然这将花费不到一秒的时间numpy,但这需要很长时间cupy如何加快标量的位移cupy