尝试在我的系统上安装 Caffe 时遇到了类似的问题。以下步骤对我有用,但它至少有一个已知问题(记录如下)。
我不确定究竟是什么导致了这个问题,但它肯定与 Nvidia Driver 和 Cuda Toolkit 安装有关,而不是由 Caffe 引起的。
完成以下步骤后,我已经能够通过以下教程和指南在我的系统上成功安装 Caffe:
更新
最近,我在尝试使 Cuda 7.5 在 Ubuntu 14.04 上运行时遇到了完全相同的问题;这种方法也解决了这个问题。眼镜:
- CPU:Intel Core i7-4700MQ(4x 2.40 GHz,超线程)
- 显卡:英伟达 GT 940M
- 内存:8 GB
- 硬盘:52.7 GB(其中安装后使用 6.7 GB)
在 UBUNTU 14.04 上安装 NVIDIA 驱动程序和 CUDA
来源:ubuntuforums.org/showthread.php?t=2246526
!!已知的问题 !!
- 系统暂停(或休眠,未确认)后,所有使用 Nvidia Driver 和 Cuda 6.5 Toolkit 的应用程序都将冻结。发生这种情况时,该命令
sudo shutdown -r now
将打印重新启动消息,但不会发生任何事情。
在具有以下硬件规格的全新 64 位 Ubuntu 14.04 安装上执行和测试:
- CPU:Intel Core i5-2410m(2x 2.30 GHz,超线程)
- 显卡:英伟达 GT 540M
- 内存:6 GB
- 硬盘:52.7 GB(其中安装后使用 8.6 GB)
在安装之前执行了以下命令:
sudo apt-get -y build-essential vim git llvm clang
以下步骤导致安装了最新的 Nvidia 驱动程序和 Cuda 6.5 Toolkit 的稳定系统:
删除以前/旧版 Nvidia 驱动程序和 Cuda 工具包的所有痕迹,或执行全新的 Ubuntu 14.04 安装。
将适用于 Ubuntu 14.04 的最新 Nvidia Driver .run 文件和您的系统规格下载到该~/Downloads
目录。例如:NVIDIA-Linux-x86_64-346.35.run
将适用于 Ubuntu 14.04 的最新 Cuda 6.5 Toolkit .run 文件和您的系统规格下载到该~/Downloads
目录。例如:cuda_6.5.14_linux_64.run
通过将以下行附加到“nouveau”驱动程序黑名单/etc/modprobe.d/blacklist.conf
(nouveau 是 Nvidia 卡的免费开源驱动程序,它是 Ubuntu 14.04 的默认值):
blacklist nouveau
options nouveau modeset=0
重新启动系统,不要登录,而是使用CTRL+ ALT+进入终端F1
杀死 lightdm(如果您更改了“lightdm”,请将其替换为您自己的显示管理器,lightdm 是 Ubuntu 14.04 的默认设置):
sudo service lightdm stop
下一步很关键,在继续之前一定要检查两次!
使用该选项运行 Nvidia Driver 安装程序--no-opengl-files
(该选项可防止 OpenGL 文件被覆盖;如果没有此选项,Unity 将无法正常运行,并且登录后屏幕将冻结):
sudo chmod +x ~/Downloads/NVIDIA-Linux-x68_64-346.35.run
sudo ~/Downloads/NVIDIA-Linux-x68_64-346.35.run --no-opengl-files
接受 EULA 并确认所有进一步的警告,但拒绝安装任何额外的东西。
重新启动并登录到桌面,使用“附加驱动程序”(系统设置 > 软件和更新 > 附加驱动程序)实用程序验证手动安装的驱动程序正在使用中。
打开终端并安装 Cuda 6.5 Toolkit:
sudo chmod +x ~/Downloads/cuda_6.5.14_linux_64.run
sudo ~/Downloads/cuda_6.5.14_linux_64.run
接受 EULA,不要安装驱动程序,安装工具包和示例(如果您愿意),保留所有默认目录。
通过将以下行附加到以下行来添加 Cuda 6.5 Toolkit 环境变量~/.bashrc
:
# For 32-bit systems, append these:
export PATH=$PATH:/usr/local/cuda-6.5/bin
export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib
# For 64-bit systems, append these:
export PATH=$PATH:/usr/local/cuda-6.5/bin
export LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib64
Nvidia 驱动程序和 Cuda 6.5 工具包现在应该已正确安装。
可选:确认您的 Nvidia 驱动程序和 Cuda 6.5 Toolkit 安装。
通过运行以下命令确认 Nvidia 驱动程序安装:
nvidia-smi
通过运行以下命令确认 Cuda 编译器安装:
nvcc -V
通过构建和运行可选安装的 Cuda 示例来确认一切正常:(使用“make”需要 build-essential)
sudo apt-get install -y build-essential
cd ~/NVIDIA_CUDA-6.5_SAMPLES/1_Utilities/deviceQuery
make
./deviceQuery
cd ~/NVIDIA_CUDA-6.5_SAMPLES/1_Utilities/bandwidthTest
make
./bandwidthTest