5

仅供参考,我有 64 位版本的 Python 2.7,我按照pycuda 安装说明安装 pycuda。

而且我运行以下脚本没有任何问题。

import pycuda.driver as cuda
import pycuda.autoinit
from pycuda.compiler import SourceModule
import numpy
a = numpy.random.randn(4,4)
a = a.astype(numpy.float32)
a_gpu = cuda.mem_alloc(a.nbytes)
cuda.memcpy_htod(a_gpu,a)

但在那之后,当执行这个语句时,

mod = SourceModule("""
__global__ void doublify(float *a)
{
int idx = threadIdx.x + threadIdx.y * 4;
a[idx] *= 2;
}
""")

我收到错误消息

CompileError: c:\users\xxxx\appdata\local\temp\tmpaoxt97\kernel.cu 的 nvcc 编译失败 [命令:nvcc --cubin -arch sm_21 -m64 -Ic:\python27\lib\site-packages\pycuda\ cuda kernel.cu] [stderr:nvcc:致命错误:nvcc 找不到受支持的 Microsoft Visual Studio 版本。仅支持 2008、2010 和 2012 版本

但我在机器上安装了 VS 2008 和 VS 2010,并按照说明设置路径和 nvcc 配置文件。有人告诉我这是怎么回事吗?

UPDATE1:正如 cgohike 所指出的,在有问题的语句之前运行以下语句将解决问题。

import os
os.system("vcvarsamd64.bat")
4

2 回答 2

3

好吧,现在说它是最终的还为时过早。即使有 cgohike 的解决方案,当我像这样运行其他脚本时也遇到了同样的错误

import pycuda.gpuarray as gpuarray
import pycuda.driver as cuda
import pycuda.autoinit
import numpy
a_gpu = gpuarray.to_gpu(numpy.random.randn(4, 4))
print "a_gpu ="
print a_gpu
a_doubled = (2*a_gpu).get()
print
print "a_doubled ="
print a_doubled

然后我找到了这个答案。所以就我而言,我在 nvcc.profile 中添加了以下行

COMPILER-BINDIR = C:\Program Files (x86)\Microsoft Visual Studio 10.0\VC\bin\amd64

在此之后,我没有更多的编译器错误。希望它可以帮助别人。

于 2013-09-26T21:38:50.517 回答
2

打电话"C:\Program Files (x86)\Microsoft Visual Studio 9.0\VC\vcvarsall.bat" amd64"C:\Program Files (x86)\Microsoft Visual Studio 10.0\VC\vcvarsall.bat" amd64之前python.exe。这将设置所有必要的环境变量以从 Python 或命令行使用 64 位 Visual Studio 编译器。

于 2013-09-26T17:31:05.947 回答