我认为这将是一个有点时髦的问题,如果我需要详细说明,请说出来。
情况如下:我有大约 2 个 GPU 内存,其中包含我的随机数,我需要在许多不同的功能中使用它们。为了防止将指针从设备函数传递到设备函数(并且如此多次),我将指针放在 gpu 常量内存中,这也为我节省了寄存器(对我来说非常重要)。现在我知道,在某些情况下,如果函数被解释为它的参数指向的内存块是不重叠的,则可以通过使用关键字来加速函数__restrict__
。
问题:我如何确保编译器知道常量内存中的指针指向的全局内存中的内存块是不重叠的(也许也很高兴知道:在生成随机内核调用之后永远不会改变)?