我使用 ubuntu 14.04 和 cuda 7.5。我使用以下方式获取 cuda 版本信息$ nvcc --version
:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015
Cuda compilation tools, release 7.5, V7.5.17
$PATH 和 $LD_LIBRARY_PATH 如下:
$ echo $PATH
/usr/local/cuda-7.5/bin:/usr/local/cuda-7.5/bin/:/opt/ros/indigo/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games
$ echo $LD_LIBRARY_PATH
/usr/local/cuda-7.5/lib64
我安装了theano。我将它与 cpu 一起使用,但不与 gpu 一起使用。本指南说
使用 GPU 测试 Theano¶ 要查看您的 GPU 是否正在使用,请将以下程序剪切并粘贴到文件中并运行它。
from theano import function, config, shared, sandbox import
> theano.tensor as T import numpy import time
>
> vlen = 10 * 30 * 768 # 10 x #cores x # threads per core iters = 1000
>
> rng = numpy.random.RandomState(22) x =
> shared(numpy.asarray(rng.rand(vlen), config.floatX)) f = function([],
> T.exp(x)) print(f.maker.fgraph.toposort()) t0 = time.time() for i in
> range(iters):
> r = f() t1 = time.time() print("Looping %d times took %f seconds" % (iters, t1 - t0)) print("Result is %s" % (r,)) if
> numpy.any([isinstance(x.op, T.Elemwise) for x in
> f.maker.fgraph.toposort()]):
> print('Used the cpu') else:
> print('Used the gpu') The program just computes the exp() of a bunch of random numbers. Note that we use the shared function to make
> sure that the input x is stored on the graphics device.
如果我使用 device=cpu 运行这个程序(在 check1.py 中),我的计算机需要 3 秒多一点,而在 GPU 上只需要 0.64 秒多一点。GPU 不会总是产生与 CPU 完全相同的浮点数。作为基准,调用 numpy.exp(x.get_value()) 的循环大约需要 46 秒。
$ THEANO_FLAGS=mode=FAST_RUN,device=cpu,floatX=float32 python check1.py [Elemwise{exp,no_inplace}()] Looping 1000 times took 3.06635117531 seconds Result is [ 1.23178029 1.61879337 1.52278066 ..., 2.20771813 2.29967761 1.62323284] Used the中央处理器
$ THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32 python check1.py 使用 gpu 设备 0:GeForce GTX 580 [GpuElemwise{exp,no_inplace}(), HostFromGpu(GpuElemwise{exp,no_inplace}.0)] 循环 1000耗时 0.638810873032 秒 结果为 [ 1.23178029 1.61879349 1.52278066 ..., 2.20771813 2.29967761 1.62323296] 使用了 GPU 请注意,Theano 中的 GPU 操作现在要求 floatX 为 float32(另见下文)。
我在没有 sudo 的情况下运行 gpu 版本命令,它会引发权限被拒绝错误:
/theano/gof/cmodule.py", line 741, in refresh
files = os.listdir(root)
OSError: [Errno 13] Permission denied: '/home/user/.theano/compiledir_Linux-3.16--generic-x86_64-with-Ubuntu-14.04-trusty-x86_64-2.7.6-64/tmp077r7U'
如果我将它与 sudo 一起使用,编译器将找不到 nvcc 路径。
ERROR (theano.sandbox.cuda): nvcc compiler not found on $PATH. Check your nvcc installation and try again.
我该如何解决这个错误?