目前,我开发了一个基于 GPU 的程序,该程序使用多个内核,这些内核通过多个流同时启动。
在我的应用程序中,多个内核需要访问一个队列/堆栈,我计划使用原子操作。
但我不知道原子操作是否在同时启动的多个内核之间起作用。请任何了解 GPU 上原子操作的确切机制或有此问题经验的人帮助我。
目前,我开发了一个基于 GPU 的程序,该程序使用多个内核,这些内核通过多个流同时启动。
在我的应用程序中,多个内核需要访问一个队列/堆栈,我计划使用原子操作。
但我不知道原子操作是否在同时启动的多个内核之间起作用。请任何了解 GPU 上原子操作的确切机制或有此问题经验的人帮助我。