0

我正在尝试并行执行多个内核。每个内核彼此独立。我正在尝试在 GPU 上执行内核。我认为是乱序执行并将每个内核分别排入队列。这是解决这个问题的方法还是有其他方法可以解决?

4

1 回答 1

0

有两种可能的解决方案:

  1. 创建一个乱序队列并将两个内核加入队列。

  2. 创建两个队列并将一个内核排入每个队列。

于 2021-08-27T20:54:43.910 回答