我正在尝试将开普勒的动态并行性用于我的一个应用程序。子内核中需要启动子内核的线程(在父内核中)的全局索引。换句话说,我想在子内核中访问父级的内置坐标变量。
有没有规范的方法可以做到这一点?或者我应该只计算父线程的全局索引(使用内置变量,如threadIdx.x等)并通过子内核的一个参数传递它?
我正在尝试将开普勒的动态并行性用于我的一个应用程序。子内核中需要启动子内核的线程(在父内核中)的全局索引。换句话说,我想在子内核中访问父级的内置坐标变量。
有没有规范的方法可以做到这一点?或者我应该只计算父线程的全局索引(使用内置变量,如threadIdx.x等)并通过子内核的一个参数传递它?