对于我正在处理的问题,我需要解决两个子问题:NxM 网格上的 Sub1 和 Kx1 网格上的 Sub2。问题是,这些子问题应该在解决过程的每一步之后进行沟通,所以我需要同时运行它们。
最终结果应如下所示:
- Sub1 求解时间 t
- Sub2 求解时间 t
- 计算时间 t+1 的 sub1 和 sub2 之间的交互项
然后使用新计算的交互项对 t+1 重复此操作,然后对 t+2、t+3 等重复此操作。使用的所有数据都存储在全局设备内存中,因此无需复制到并从步骤之间的设备。
我的问题是,我如何告诉 OpenCL 我想同时处理两个不同大小的问题?