假设,我在 CUDA 内核函数中为每个线程声明了一个局部变量:
float f = ...; // some calculations here
还假设声明的变量由编译器放置到本地内存(这与全局内存相同,但据我所知,它仅对一个线程可见)。f
我的问题是在阅读时会合并访问吗?
假设,我在 CUDA 内核函数中为每个线程声明了一个局部变量:
float f = ...; // some calculations here
还假设声明的变量由编译器放置到本地内存(这与全局内存相同,但据我所知,它仅对一个线程可见)。f
我的问题是在阅读时会合并访问吗?