我的 CUDA 应用程序对卷执行关联缩减。本质上,每个线程都会计算以原子方式添加到全局内存中同一输出缓冲区的重叠位置的值。
是否可以使用不同的输入参数和相同的输出缓冲区同时启动这个内核?换句话说,每个内核将共享相同的全局缓冲区并以原子方式写入它。
所有内核都在同一个 GPU 上运行。
我的 CUDA 应用程序对卷执行关联缩减。本质上,每个线程都会计算以原子方式添加到全局内存中同一输出缓冲区的重叠位置的值。
是否可以使用不同的输入参数和相同的输出缓冲区同时启动这个内核?换句话说,每个内核将共享相同的全局缓冲区并以原子方式写入它。
所有内核都在同一个 GPU 上运行。