问题标签 [pyopencl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - OpenCL 矩阵乘法 - 得到错误的答案
这是一个让我发疯的简单 OpenCL 矩阵乘法内核:
顺便说一句,我正在使用 pyopencl。
哪里(输入)
我得到的输出:
有时我会得到:
否则我得到:
但输出应该是:
我不知道我在这里犯了什么错误。我一整天都没有运气。
请在这件事上给予我帮助
这是完整的python代码:
我正在使用 Python 2.7.x、pyopencl 2012.1、AMD APP SDK
python - 如何在pyopencl中明确设置工作维度?
在用 C++ 编写 OpenCL 主机程序时,我们使用以下 API 来调用 OpenCL 内核:
这里第三个参数设置工作维度。在 python 中使用 pyopencl 时,我们将内核作为程序的一部分称为:
例如:
那么如何使用pyopencl在python中显式设置“work_dim”?
python - 有人可以帮助我使用 Cygwin 安装 PyOpenCL 吗?
我不知道如何用 Cygwin 安装 pyopencl。以前从未使用过 Cygwin,所以我对如何启动 python 并使用它来运行我的 .py 设置文件感到非常迷茫。
opencl - 理解 opencl 内核中的移位和屏蔽
考虑以下内核:
认为:
4 个线程正在运行,idx=0,1,2,3 和 Image[idx]=idx+100
最后一行中 temp2 的值是多少?
更新:
假设任何合适的值
python - Pyopencl:to_device 和 Buffer 的区别
让
和有什么区别
和
?
和有什么区别
和
?
opencl - 重新利用 openCL 内存
大家好,以两个openCL内核为例,一个内核让我们说add,另一个是sub。
添加内核是
子内核是
对于这两个输入相同的两个内核,我需要将相同的输入(输入 1 和输入 2)从主机内存复制到设备两次,这可能会增加一些性能成本。
有什么方法可以让我复制一次数据并在任何功能中重新使用它,直到我不释放内存?
python - 编译 pyopencl
我正在尝试在 virtualenv 目录中的 Ubuntu 12.10 上编译 pyopencl,但它似乎输出了一个错误:
opencl - local_work_size 对性能的影响及其原因
大家好......
我是opencl的新手,并试图探索更多@它。
openCL 程序中 local_work_size 的工作是什么以及它对性能的影响。
我正在研究一些图像处理算法,对于我的 openCL 内核,我给出了
当我改变时,对于相同的内核
保持一切不变。
我的性能提高了大约 4-5 倍。
opencl - PyOpenCL 图像处理 Vrs OpenCL 图像处理
就图像处理的实时实现而言algorithm(fitering,segmentation,matching)
,哪个速度更快:PyOpenCL还是OpenCL?
- 如何开始使用 PyOpenCL?
- 哪些 IDE 可用于在 PyOpenCL 中编程?
- PyOpenCL 是否有单独的 SDK,或者我们是否使用 Nvidia 或 AMD 提供的相同 OpenCL SDK?
PyOpenCL 中没有太多可用的示例代码,因为它们在 OpenCL 中,请指定任何使所有内容都与 PyOpenCL 友好的链接......!
blender - 在 Blender 2.65 BGE 中创建 PyOpenCL 上下文
如何使用 gl interop 在 Blender BGE (python3.3) 中创建上下文?当我用这种方式
搅拌机崩溃了。我使用 Blender 2.65 & pyopencl form git。Ubuntu 12.10。