我编写了一个简单的内核,在其中我将共享内存数组声明为
extern __shared__ float As[100];
在我的内核启动中,我指定了共享内存的 number_of_bytes。编译内核(到 PTX)时出现错误“意外的地址空间”。我正在使用来自 svn 的相当新版本的 LLVM(3.3 正在进行中)。有什么想法我在这里做错了吗?问题似乎与 extern 关键字有关,但是我还要如何指定它呢?(共享内存)。我应该使用不同的 LLVM 构建吗?
配置 CUDA 5.0 , Nvidia Tesla C1060