正如标题所说,当我运行我的OpenCL
内核时,整个屏幕停止重绘(显示器上显示的图像保持不变,直到我的程序完成计算。即使我从笔记本上拔下它并重新插入也是如此 - 总是显示相同的图像)并且计算机似乎也没有对鼠标移动做出反应 - 光标停留在同一位置。
我不确定为什么会这样。这可能是我的程序中的错误,还是这是标准行为?
在谷歌上搜索时,我在 AMD 的论坛上发现了这个帖子,那里的一些人建议这是正常的,因为 GPU 在忙于计算时无法刷新屏幕。
如果这是真的,还有什么办法可以解决这个问题吗?
我的内核计算可能需要几分钟的时间,并且让我的计算机在整个这段时间内几乎无法使用真的很痛苦。
EDIT1:这是我当前的设置:
- 显卡是 ATI Mobility Radeon HD 5650,具有 512 MB 内存和来自 AMD 网站的最新 Catalyst beta 驱动程序
- 图形是可切换的 - 英特尔集成/ATI 专用卡,但我已禁用 BIOS 中的切换,否则我无法让驱动程序在 Ubuntu 上运行。
- 操作系统是 Ubuntu 12.10(64 位),但这也发生在 Windows 7(64 位)上。
- 我的显示器通过 HDMI 插入(但笔记本屏幕也冻结了,所以这应该不是问题)
EDIT2:所以在玩了一天我的代码之后,我从你的回复中得到了建议,并将我的算法更改为这样的东西(在伪代码中):
for (cl_ulong chunk = 0; chunk < num_chunks; chunk += chunk_size)
{
/* set kernel arguments that are different for each chunk */
clSetKernelArg(/* ... */);
/* schedule kernel for next execution */
clEnqueueNDRangeKernel(cmd_queue, kernel, 1, NULL, &global_work_size, NULL, 0, NULL, NULL);
/* read out the results from kernel and append them to output array on host */
clEnqueueReadBuffer(cmd_queue, of_buf, CL_TRUE, 0, chunk_size, output + chunk, 0, NULL, NULL);
}
所以现在我在主机上拆分整个工作负载并将其分块发送到 GPU。对于每个数据块,我将一个新内核排入队列,并且从中获得的结果以正确的偏移量附加到输出数组中。
这就是你的意思是计算应该被划分吗?
这似乎是解决冻结问题的方法,甚至现在我能够处理比可用 GPU 内存大得多的数据,但我还必须进行一些良好的性能测量,看看什么是好的块大小.. .