ubuntu16.04安装nvidia驱动cuda,cudnn和tensorflow-gpu(代码片段)

莫失莫忘Lawlite 莫失莫忘Lawlite     2022-10-30     661

关键词:

  • 本文个人博客地址: 点击查看
  • 之前有在阿里云GPU服务器上弄过: 点击查看, 这里从装Nvidia开始

一、 安装Nvidia驱动

1.1 查找需要安装的Nvidia版本

1.1.1 官网

1.1.2 命令行查看推荐驱动

  • 查看驱动:ubuntu-drivers devices, 如下图
ubuntu@ubuntu-System-Product-Name:~$ ubuntu-drivers devices
== cpu-microcode.py ==
driver   : intel-microcode - distro free

== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
vendor   : NVIDIA Corporation
modalias : pci:v000010DEd00001B06sv00001458sd0000374Dbc03sc00i00
driver   : nvidia-410 - third-party free recommended
driver   : nvidia-384 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin
driver   : nvidia-390 - third-party free
driver   : nvidia-396 - third-party free

  • 添加 ppa:
    • sudo add-apt-repository ppa:graphics-drivers/ppa (注意联网,去掉代理)
    • sudo apt update
  • 然后执行ubuntu-drivers devices就可以看到如上的结果
  • 安装:
  • 查看:
    • nvidia-smi
    • 显示如下结果
(wangyongzhi_ml) ubuntu@ubuntu-System-Product-Name:/usr/local/cuda-10.0/bin$ nvidia-smi
Thu Oct 25 15:49:46 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.66       Driver Version: 410.66       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  Off  | 00000000:01:00.0  On |                  N/A |
|  0%   44C    P8    20W / 250W |     42MiB / 11174MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  Off  | 00000000:02:00.0 Off |                  N/A |
|  0%   50C    P8    20W / 250W |      2MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0       949      G   /usr/lib/xorg/Xorg                            39MiB |
+-----------------------------------------------------------------------------+

二、安装cuda

  • 官网: https://developer.nvidia.com/cuda-toolkit-archive
  • 选择想要安装的版本,这里选择的是cuda-9.0, 下载
  • 安装
    • chmod +x cuda_9.0.176_384.81_linux-run
    • sudo ./cuda_9.0.176_384.81_linux-run
    • 根据提示安装选择即可
    • 添加环境变量
      • vim ~/.bashrc
      • 加入环境变量
# cuda9.0
export PATH=/usr/local/cuda-9.0/bin/:$PATH;
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64/:$LD_LIBRARY_PATH;
  • 测试1
    • nvcc -V
    • 如下图,版本为V9.0.176
(wangyongzhi_ml) ubuntu@ubuntu-System-Product-Name:~/wangyongzhi/software$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
  • 测试2
    • 如果上面安装过程中选择了安装Examples, 会在 ~ 文件夹下生成测试NVIDIA_CUDA-9.0_Samples 的文件
    • 进入: cd NVIDIA_CUDA-9.0_Samples
    • make
    • 进入 NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release 文件夹
      • 执行: ./deviceQuery, 可以看到类似如下信息
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 2 CUDA Capable device(s)

Device 0: "GeForce GTX 1080 Ti"
  CUDA Driver Version / Runtime Version          10.0 / 9.0
  CUDA Capability Major/Minor version number:    6.1
  Total amount of global memory:                 11174 MBytes (11717181440 bytes)
  (28) Multiprocessors, (128) CUDA Cores/MP:     3584 CUDA Cores
  GPU Max Clock rate:                            1683 MHz (1.68 GHz)
  Memory Clock rate:                             5505 Mhz
  Memory Bus Width:                              352-bit
  L2 Cache Size:                                 2883584 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024

三、安装cudnn

  • 安装
    • tar -zxvf cudnn-9.0-linux-x64-v7.3.1.20.tgz
    • 将解压得到的cuda 文件夹下的内容拷贝到对应的 /usr/local/cuda-9.0文件夹下即可

四、安装Anaconda和tensorflow-gpu

# anaconda3
export PATH=/home/ubuntu/anaconda3/bin:$PATH
  • 创建虚拟环境,防止污染他人使用环境

    • conda create -n xxx python-3.6
    • conda install tensorflow-gpu
  • 测试

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
  • 打印如下信息:
2018-10-25 16:25:35.683507: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1405] Found device 0 with properties:
name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.683
pciBusID: 0000:01:00.0
totalMemory: 10.91GiB freeMemory: 10.72GiB
2018-10-25 16:25:35.783459: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:897] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2018-10-25 16:25:35.783843: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1405] Found device 1 with properties:
name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.683
pciBusID: 0000:02:00.0
totalMemory: 10.92GiB freeMemory: 10.76GiB
2018-10-25 16:25:35.784321: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1484] Adding visible gpu devices: 0, 1
2018-10-25 16:25:36.069610: I tensorflow/core/common_runtime/gpu/gpu_device.cc:965] Device interconnect StreamExecutor with strength 1 edge matrix:
2018-10-25 16:25:36.069634: I tensorflow/core/common_runtime/gpu/gpu_device.cc:971]      0 1
2018-10-25 16:25:36.069637: I tensorflow/core/common_runtime/gpu/gpu_device.cc:984] 0:   N Y
2018-10-25 16:25:36.069639: I tensorflow/core/common_runtime/gpu/gpu_device.cc:984] 1:   Y N
2018-10-25 16:25:36.069852: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1097] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 10367 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1)
2018-10-25 16:25:36.101498: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1097] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:1 with 10409 MB memory) -> physical GPU (device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:02:00.0, compute capability: 6.1)
Device mapping:
/job:localhost/replica:0/task:0/device:GPU:0 -> device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1
/job:localhost/replica:0/task:0/device:GPU:1 -> device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:02:00.0, compute capability: 6.1
2018-10-25 16:25:36.134430: I tensorflow/core/common_runtime/direct_session.cc:288] Device mapping:
/job:localhost/replica:0/task:0/device:GPU:0 -> device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:01:00.0, compute capability: 6.1
/job:localhost/replica:0/task:0/device:GPU:1 -> device: 1, name: GeForce GTX 1080 Ti, pci bus id: 0000:02:00.0, compute capability: 6.1

五、 多个cuda版本切换

  • 安装cuda-9.0 会在 /usr/local/ 目录下
    • 如下图,它会创建一个软连接指向了 /usr/local/cuda-9.0/
(wangyongzhi_ml) ubuntu@ubuntu-System-Product-Name:/usr/local$ ll
总用量 48
drwxr-xr-x 12 root root 4096 10月 25 14:51 ./
drwxr-xr-x 13 root root 4096 10月 25 09:39 ../
drwxr-xr-x  2 root root 4096 4月  21  2016 bin/
lrwxrwxrwx  1 root root   19 10月 25 00:41 cuda -> /usr/local/cuda-9.0/
drwxr-xr-x 19 root root 4096 10月 25 14:52 cuda-10.0/
drwxr-xr-x 18 root root 4096 10月 25 00:41 cuda-9.0/
drwxr-xr-x  2 root root 4096 4月  21  2016 etc/
drwxr-xr-x  2 root root 4096 4月  21  2016 games/
drwxr-xr-x  2 root root 4096 4月  21  2016 include/
drwxr-xr-x  4 root root 4096 4月  21  2016 lib/
lrwxrwxrwx  1 root root    9 10月 24 14:52 man -> share/man/
drwxr-xr-x  2 root root 4096 4月  21  2016 sbin/
drwxr-xr-x  8 root root 4096 4月  21  2016 share/
drwxr-xr-x  2 root root 4096 4月  21  2016 src/
  • 所以正常安装cuda 其他版本,然后创建软连接指向对应的版本即可
sudo rm -rf cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda

Reference

ubuntu16.04下安装cuda8.0

一、首先安装NVIDIA显卡驱动通过NVIDIA-Linux-x86_64-367.44.run文件安装。1.添加PPA.sudoadd-apt-repositoryppa:graphics-drivers/ppa2.刷新并安装新的驱动程序sudoapt-getupdatesudoapt-getinstallnvidia-367nvidia-settings(如果需要的话,)卸载:删除所有的nvi 查看详情

ubuntu16.04安装nvidia驱动cuda,cudnn和tensorflow-gpu(代码片段)

...ff0c;推荐410版本的1.1.2命令行查看推荐驱动查看驱动:ubuntu-driversdevices,如下图ubuntu@ubuntu-System-Product-Name:~$ubuntu-driversdevices==cpu-microcode.py==driver:intel-microcode-distrofree==/sys/devices/pci0000:00/0000:00:01.0/0000:01:00... 查看详情

ubuntu16.04下安装tensorflow(gpu)

参考:http://blog.sina.com.cn/s/blog_672f698e0102wavp.html1.首先安装nvidia显卡驱动:系统设置->软件更新->附加驱动->选择nvidia最新驱动(361)->应用更改?2.下载CUDA8.0地址https://developer.nvidia.com/cuda-release-candidate-download( 查看详情

ubuntu16.04下安装cuda,cudnn及tensorflow-gpu版本过程(代码片段)

这篇文章主要依据两篇文章:深度学习主机环境配置:Ubuntu16.04+NvidiaGTX1080+CUDA8.0深度学习主机环境配置:Ubuntu16.04+GeForceGTX1080+TensorFlow不过在实际运行的过程中,有一定的不同之处,随着时间的推移,一些... 查看详情

ubuntu18.04安装cuda

参考技术AUbuntu16.04重装系统安装完所需的三个文件后,进入mnistCUDNN文件夹,对cpp程序进行编译后直接运行出现TestPassed即可!nvidia-smi后出现如下信息:NVIDIA-SMIhasfailedbecauseitcouldn'tcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriver... 查看详情

ubuntu16.04+titanxp安装显卡驱动+cuda9.0+cudnn+其他软件(代码片段)

硬件环境ubuntu16.04LTS+windows10双系统NVIDIATiTanXP显卡(12G)软件环境搜狗输入法显卡驱动:LINUXX64(AMD64/EM64T)DISPLAYDRIVER(418.56)  https://www.nvidia.cn/Download/index.aspx?CUDA:Cuda9.0  https://develop 查看详情

ubuntu安装nvidia驱动+cuda+cudnn+anaconda3+tensorflow-gpu(代码片段)

...sorFlow-gpu1.12.1一、安装环境当前系统配置:系统:Ubuntu16.04LTSCPU:Intel®Core™i5-8400CPU@2.80GHz內存:16GB显卡:NVIDIACorporationGP106[GeForceGTX10606GB]二、安装NVIDIA显卡驱动1、如果之前安装过英伟达驱动,要先卸载... 查看详情

ubuntu16.04卸载nvidia驱动

通过附加驱动安装显卡驱动后有些不满意需要换驱动首先要卸载驱动以我安装的nvidia-331-updates为例如果你安装的其它版本,请自行更改命令sudoapt-getremove--purgenvidia-331-updates如果安装的是官网下载的驱动则重新运行run文件来卸... 查看详情

ubuntu16.04下安装nvidia驱动心得

首先机器重启后莫名出现循环登录错误,然后按照网上的方法卸载掉nvidia驱动后,可以正常登录。但还是要再装nvidia驱动。网上说的各种方法都试过了,geforce.cn官网上推荐的各种版本的run驱动程序都试了一遍,总是报Buildingkernel... 查看详情

Ubuntu 14.04如何在不安装nvidia驱动的情况下安装cuda 6.5

】Ubuntu14.04如何在不安装nvidia驱动的情况下安装cuda6.5【英文标题】:Ubuntu14.04howtoinstallcuda6.5withoutinstallingnvidiadriver【发布时间】:2015-02-0301:58:20【问题描述】:我正在使用CPU内核I74790和两个GPUGTX7604GBram/1152内核的工作站上工作,... 查看详情

ubuntu如何卸载nvidia驱动

参考技术A有时候我们在安装环境的过程中,往往会遇到很多的问题。尤其是CUDA的安装过程中,这时候如果出错就需要卸载驱动重新安装。通过下面的几条命令就可以轻松的卸载CUDA安装。如果要卸载CUDAToolKit则输入下面的命令卸... 查看详情

ubuntu22.04+nvidia驱动+cuda11.8+cudnn8.6(代码片段)

Ubuntu22.04+Nvidia驱动+Cuda11.8一、准备环境ubuntu22.04nvidia显卡这里使用的是RTX3060已安装Python3.10二、安装pip3#安装sudoaptinstallpython3-pip#升级sudopip3install--upgradepip#如果要卸载,使用命令:sudoapt-getremovepyt 查看详情

ubuntu22.04+nvidia驱动+cuda11.8+cudnn8.6(代码片段)

Ubuntu22.04+Nvidia驱动+Cuda11.8一、准备环境ubuntu22.04nvidia显卡这里使用的是RTX3060已安装Python3.10二、安装pip3#安装sudoaptinstallpython3-pip#升级sudopip3install--upgradepip#如果要卸载,使用命令:sudoapt-getremovepython3-pip三、Nvidia驱动... 查看详情

markdown在ubuntu/centos/fedoralinux操作系统上安装nvidia驱动程序和cuda(代码片段)

查看详情

解决ubuntu安装nvidia驱动(咨询nvidia工程师的解决方案)(代码片段)

前言这两天把实验室服务器给装成了Ubuntu16.04+cuda8.0+cudnn5.0,本来以为应该没什么问题,结果那折腾得……不说了,都是泪。具体Caffe,Tensorflow,Mxnet的安装教程已经很多了,我这儿就不说了。本文主... 查看详情

ubuntu16.04tensoflow使用服务器需要支持gpu吗

参考技术A1.下载1.1系统镜像由于我尝试了ubuntu14.04,安装Nvidia驱动之后,会出现循环登录的问题,并始终无法找到有效的解决途径,所以只能选择ubuntu16.04了。1.2CUDA8.0说明:(1)在NVIDIA的CUDA下载页面下,选择要使用的CUDA版本进... 查看详情

ubuntu安装cuda(代码片段)

目录1、查看系统推荐的cuda版本2、官网下载cuda软件包3、安装4、环境配置5、验证cuda是否正常1、查看系统推荐的cuda版本查看前应先安装显卡驱动,可以查看NVIDIA显卡驱动安装nvidia-smi这里显示的是cuda11.4版本2、官网下载cuda软... 查看详情

ubuntu20.04上3090显卡安装nvidia驱动和cuda11.4,cudnn,anaconda,以及解决向日葵无法连接和重装ubuntu20.04遇到的问题(代码片段)

Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题安装的步骤以及出现的问题一、安装Nvidia驱动二、安装CUDA三、安装cuDNN四、安装conda五、安装ssh六、解决向... 查看详情