我想知道是否可以编写一个持久的 GPU 函数。我有疑问,但我不确定调度程序是如何工作的。
我正在寻找处理未知数量的数据点(大约 5000 万)。数据以 20 块左右的形式到达。如果我可以将这 20 个点放入 GPU“桶”中,并让这个“持久”操作在它们进入时抓取并处理它们,那就太好了。完成后,抓取结果。
当存储桶为空时,我可以让 GPU 忙于处理虚拟数据。但我认为部分空桶的竞争条件将是一个问题。
我怀疑当这个持久性操作正在运行时,我将无法在 GPU 上运行任何其他操作。即让其他不敬业的SM 工作。
这是一种可行的(费米)GPU 方法,还是只是一个坏主意?