我的 CUDA 内核看起来像这样。
#define MY_AWESOME_MACRO(foo, bar) (foo * bar * 123 + 456)
__global__ void my_CUDA_kernel(int* cool, float* beans) {
// Some computation.
}
我应该将宏放在函数内部还是外部?我用谷歌搜索了一下,有些人两者都做。以一种方式或另一种方式这样做有什么害处吗?
我的 CUDA 内核看起来像这样。
#define MY_AWESOME_MACRO(foo, bar) (foo * bar * 123 + 456)
__global__ void my_CUDA_kernel(int* cool, float* beans) {
// Some computation.
}
我应该将宏放在函数内部还是外部?我用谷歌搜索了一下,有些人两者都做。以一种方式或另一种方式这样做有什么害处吗?