我有许多结构(类)和独立函数,我喜欢单独编译然后链接到 CUDA 内核,但是External calls are not supported
在编译(而不是链接)内核时出现错误。nvcc 强制始终使用内核中的内联函数。这非常令人沮丧!如果有人想出了实现增量编译的方法,请分享。
另请参阅 NVIDIA 论坛上的以下主题。 http://forums.nvidia.com/index.php?s=&showtopic=103256&view=findpost&p=1009242
我有许多结构(类)和独立函数,我喜欢单独编译然后链接到 CUDA 内核,但是External calls are not supported
在编译(而不是链接)内核时出现错误。nvcc 强制始终使用内核中的内联函数。这非常令人沮丧!如果有人想出了实现增量编译的方法,请分享。
另请参阅 NVIDIA 论坛上的以下主题。 http://forums.nvidia.com/index.php?s=&showtopic=103256&view=findpost&p=1009242
目前您无法在 CUDA 中从 GPU 调用设备函数,这就是它们被内联的原因。
Fermi硬件支持设备功能,无需内联。
好的,现在可以使用 CUDA 5 完成。