cuda9.0升级10.0记录

起因

目前tensorflow2.0和pytorch1.0均已经需要cuda10.0了,所以记录一下cuda的升级过程

升级驱动

  1. 下载对应的驱动

    1
    https://www.nvidia.cn/Download/index.aspx?lang=cn
  2. 删除cuda9.0对应的驱动

    1
    apt-get remove --purge nvidia-384 nvidia-modprobe nvidia-settings
  3. 重启服务器

  4. 关闭X-server

    1
    2
    3
    /etc/init.d/lightdm stop
    # 恢复以后要重启
    /etc/init.d/lightdm restart
  5. 安装驱动

    1
    sh NVIDIA-Linux-x86_64-410.104.run

这样驱动就升级完毕了,通过nvidia-smi可以验证

安装torch

1
2
3
4
5
6
7
conda create -n pytorch

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

conda install pytorch torchvision cudatoolkit=10.2