我在当前项目中使用 Thrust,因此我不必自己编写device_vector
抽象或(分段)扫描内核。
到目前为止,我已经使用推力抽象完成了所有工作,但是对于简单的内核或不容易转换为 for_each 或转换抽象的内核,我更愿意在某些时候编写自己的内核。
所以我的问题是:我可以通过 Thrust(或者可能是 CUDA)询问当前正在使用哪个设备以及它具有哪些属性(最大块大小、最大共享内存,所有这些东西)?
如果我无法获得当前设备,那么如果我提供内核寄存器和共享内存要求,是否有某种方法可以让我获得计算内核尺寸的动力?