“pyopencl”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

2211 浏览

opencl - 尽管有障碍，但打开 CL 没有同步

我刚开始通过 Python 的 PyOpenCL 接口使用 OpenCL。我试图创建一个非常简单的“循环”程序，其中每个内核中每个循环的结果取决于上一个循环周期中另一个内核的输出，但我遇到了同步问题：

主机应用程序是

结果是

如您所见，一些结果值是正确的。例如，第三个位置 = 5 = 3 + 2，但例如第二个位置是 2 = 0 + 2。因此，尽管存在障碍，但总和超过了其他线程在不同时间点的结果。我认为屏障会确保所有线程都到达它并将它们的结果写入全局内存？

这可能是非常简单的事情，我将不胜感激任何提示和评论！

PS：我正在使用 Intel SDK 在 Sandy Bridge CPU 上运行它。

opencl pyopencl

2013-06-15T19:03:12.073

0 投票

1 回答

1359 浏览

opencl - 测量和最小化 OpenCL 开销

我有一个 pyopencl 程序，计算时间很长（每次运行约 3-5 小时）。我有几个内核在循环中一一启动。所以我有这样的事情：

我测量了时间，得到了以下结果：

系统时间为4:30小时（通过linuxtime命令测量）
纯opencl基于事件的计时是3:30小时（加载+计算+存储）

我想知道：

OpenCL 程序的最小开销有多大？在我的情况下，它是 35%
我应该相信基于事件的计时吗？
启用分析是否会为整个程序执行时间增加一些重要时间？

我知道开销取决于程序，而且我知道 python 不如纯 C 或 CPP 快。但我相信，当我将所有繁重的计算转移到 OpenCL 内核时，我的损失不会超过 5-7%。如果我错了，请纠正我。

PS AMD OpenCL、AMD GPU

2013-07-01T16:11:31.240

0 投票

1 回答

503 浏览

debugging - 将 GPU 分析器（例如 CodeXL）与 PyOpenCL 一起使用

我有我的复杂 PyOpenCL 应用程序，其中包含许多缓冲区创建、内核模板等。我想在 GPU 上分析我的应用程序，看看我的情况是什么瓶颈。

是否可以在 PyOpenCl 应用程序中使用一些 gpu 分析器？例如 CodeXL。

PS 我知道事件分析，但这还不够。

debugging profile gpgpu profiler pyopencl

2013-07-10T14:29:31.587

0 投票

1 回答

10606 浏览

memory-management - 在 OpenCL 内核中创建本地数组动态

我有一个 OpenCL 内核，它需要将一个数组处理为多个数组，其中每个子数组和保存在本地缓存数组中。

例如，想象一下 fowling 数组：

每个工作组都有一个数组（在示例中我们有 2 个工作组）；
每个工作项处理两个数组索引（例如将值索引乘以 local_id），其中工作项结果保存在工作组共享数组中。
/li>

问题是我无法通过使用内核参数来定义缓存数组大小，但我需要为了拥有一个动态内核。

如何动态创建它？就像 c 中的 malloc 函数...

或者唯一可用的解决方案是将临时数组发送到我的内核函数？

memory-management opencl gpgpu pyopencl

2013-07-10T15:20:45.567

0 投票

1 回答

1893 浏览

python - 如何使用 pyopencl 将字符串列表传递给 opencl 内核？

如何以正确的方式将字符串列表传递给 opencl 内核？

我使用缓冲区尝试过这种方式（参见下面的代码），但我失败了。

OpenCL (struct.cl):

Python（opencl_struct.py）：

我第一次运行程序时将“但无法输出”作为第 4 个列表元素。然后我通过增加和减少列表的元素来玩弄。最后出现了这个问题： 程序的输出应该是（短版）

(GPU) 输出：太酷了！

(GPU) 输出：这是一个列表！

（GPU）输出：一个大！

(GPU) 输出：WTF 是这样吗？

但它是：

python opencl_struct.py

INlist : ['这很酷！'，'这是一个列表！'，'一个大列表！'，'WTF 是这样吗？']

最大的字符串 18

len(OUT_host_buffer) 160 (GPU) output : ('这非常酷！\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\ x00\x00\x00\x00\x00\x00', '这是一个列表！\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\ x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00', '一个大的！\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00 \x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00', '但是输出失败。: -（\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'）

(GPU) 输出：太酷了！

(GPU) 输出：这是一个列表！

（GPU）输出：一个大！

(GPU) 输出：但无法输出。:-(