安装NVIDIA driver 510.47.03 cuda11.6 cudnn

本文详细记录了在Ubuntu系统中安装NVIDIA驱动510.47.03、CUDA11.6和cudnn时可能遇到的问题及解决方案,包括禁用Nouveau驱动、处理自动更新提示、解决DNS解析问题以及添加环境变量等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装NVIDIA driver 510.47.03 cuda11.6 cudnn 经常安装的时候会遇到奇奇怪怪的问题,所以记录下来。

1. 安装NVIDIA driver 510.47.03。如下命令:

​ 安装NVIDIA driver 510.47.03之前,先查看下安装NVIDIA driver 的版本是否是510.47.03,如果不是,要先卸载,然后再安装。例如 如果通过 nvidia-smi 命令,查看,发现版本为NVIDIA Driver Version: 470.94,则需卸载重新安装。

下载好安装包NVIDIA-Linux-x86_64-510.47.03.run后,执行如下命令

chmod 755 NVIDIA-Linux-x86_64-510.47.03.run
sudo ./NVIDIA-Linux-x86_64-510.47.03.run
上述第二条命令执行过程中,有一条是否自动更新和重启的提示时,选择【no】

​ 如果提示报An alternate method of installing the NVIDIA driver was detected… …,点击Continue installation后,报ERROR:The Nouveau kernel driver is currently in use by ypur system.导致无法安装成功。则需禁用Nouveau驱动。方法如下:

① 打开terminal, 输入如下命令:
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
② 在文件最后添加
blacklist nouveau
options nouveau modeset=0
③ 更新initramfs使其生效
sudo update-initramfs -u
④ 重启机器
reboot
⑤ 终端输入语句验证是否禁用成功
lsmod | grep nouveau    或      lspci | grep nouveau
若没有结果输出,则表示禁用成功。

​ 另,如果输入sudo ./NVIDIA-Linux-x86_64-510.47.03.run时,报错报错【ERROR: You appear to be running an X server; please exit X before installing… …】解决办法:

远程桌面打开终端,在sudo root权限下,执行
service lightdm stop   # 此命令貌似把界面窗口关掉了
然后通过MobaXterm远程依次输入命令
chmod 755 NVIDIA-Linux-x86_64-510.47.03.run
sudo ./NVIDIA-Linux-x86_64-510.47.03.run
就可以安装成功。安装过程中,切记涉及选择是否自动更新的时候要选择【No】

另,如果输入sudo ./NVIDIA-Linux-x86_64-510.47.03.run时,报错报错【ERROR: An NVIDIA kernel module ‘nvidia-uvm’ appears to already be loaded in your kernel. This… …】解决办法:

因为你卸载完没有重启机器,重启一下机器就好了。

另,(先往下执行,如果后面报同样问题,再回来看,之前一直同样方式没报过问题)后面不知道为什么,装cudnn的时候怎么都装不上,主要是在运行命令sudo apt-get update出现一堆如“暂时不能解析域名’nvidia.github.io’… …和无法下载… …” 的问题。 解决此问题,过程记录如下

采用更换ubuntu的源为阿里源如下:
cd /etc/apt
cp sources.list sources.list.bak
vim sources.list
复制阿里源的相关网址路径进去
sudo apt update
结果还是有类似“暂时不能解析域名‘mirrors.aliyun.com’... ...的问题”于是如下操作:
cd /etc/
vim resolv.conf
在里面增加如下内容
nameserver 8.8.8.8
nameserver 114.114.114.114
然后退出,ping通www.baidu.com之后,执行sudo apt update,结果:
【
正在读取软件包列表... 完成
W: 目标 Packages (Packages) 在 /etc/apt/sources.list.d/nvidia-container-runtime.list:1 和 /etc/apt/sources.list.d/nvidia-docker.list:1 中被配置了多次
... ...此处都是警告,不知道会不会有影响
】就是报了一堆警告,可以先不用管他直接往下安装,如果有问题的话,就找到对应的文件把配置了多次的那个代码找到然后注释掉就可以了。

经验:显卡常由于内核自动更新无法使用,故需关闭显卡内核的自动更新
vi /etc/apt/apt.conf.d/10periodic
vi /etc/apt/apt.conf.d/20auto-apgrades

将上述命令里面的参数值都改成0即可。

卸载NVIDIA驱动的方法

方法一
sudo bash NVIDIA-Linux-x86_64-510.47.03.run -uninstall
方法二
sudo apt-get --purge remove nvidia*
sudo apt autoremove
卸载完成之后,记得重启机器再安装,然后再如下命令安装
sudo ./NVIDIA-Linux-x86_64-510.47.03.run -no-x-check

2. Install CUDA Toolkit 11.6.1 (CUDA 11.6 Update 1)

sudo sh cuda_11.6.1_510.47.03_linux.run --silent --toolkit

添加环境变量

nano ~/.bashrc       // nano也可以换成 vim命令
插入如下路径 如下 到环境变量中

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.6/lib64
export PATH=$PATH:/usr/local/cuda-11.6/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.6
或(下面这两行比较繁琐,建议插入上面的三行)
export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后按Ctrl+X 选择yes  即可退出
再source运行一下
source ~/.bashrc

执行nvcc -V会显示版本如下 说明成功
   【 
    nvcc: NVIDIA (R) Cuda compiler driver
    Copyright (c) 2005-2022 NVIDIA Corporation
    Built on Thu_Feb_10_18:23:41_PST_2022
    Cuda compilation tools, release 11.6, V11.6.112
    Build cuda_11.6.r11.6/compiler.30978841_0
    】

3 安装cudnn

Run follow commands to install:

运行下列命令安装:

sudo dpkg -i cudnn-local-repo-ubuntu2004-8.4.0.27_1.0-1_amd64.deb
sudo apt-get update
sudo apt install libcudnn8=8.4.0.27-1+cuda11.6 
sudo apt install libcudnn8-dev=8.4.0.27-1+cuda11.6

运行第一句命令时报如下问题

The public CUDA GPG key does not appear to be installed.

提示缺少key,安装key,使用下面的命令(To install the key, run this command)

sudo apt-key add /var/cudnn-local-repo-ubuntu2004-8.4.0.27/7fa2af80.pub

运行sudo apt-key add /var/cudnn-local-repo-ubuntu2004-8.4.0.27/7fa2af80.pub即可解决

运行sudo apt-get update时报没有公钥…可以不用管他

<think>好的,我需要帮助用户下载并安装CUDA 11.6。首先,我得回顾一下用户提供的引用内容,看看有没有相关的步骤和注意事项。 用户给出了四个引用,其中引用[1]提到下载CUDA 11.6.2的链接和安装后的验证步骤,以及架构需要注意x86_64。引用[2]提供了直接使用wget命令下载CUDA 11.6.2的安装包,并执行安装的指令。引用[3]详细说明了在Ubuntu 20.04上安装CUDA 11.6的步骤,包括卸载旧驱动、禁用Nouveau驱动、重启后安装CUDA。引用[4]是关于在服务器上离线安装PyTorch与CUDA 11.6的环境配置。 用户的需求是下载并安装CUDA 11.6。根据这些引用,我应该整理出一个清晰的步骤指南。首先,需要确认系统架构是否符合,然后卸载旧驱动,禁用Nouveau驱动,接着下载CUDA安装包,执行安装,最后配置环境变量并验证安装是否成功。 需要注意的是,引用[3]中提到在安装前要彻底卸载旧版NVIDIA驱动,并禁用Nouveau驱动,否则可能会导致冲突或安装失败。此外,安装完成后需要将CUDA路径添加到环境变量中,确保系统能够识别。验证步骤包括检查nvcc版本和运行示例程序,这很重要,可以确认安装是否成功。 另外,用户可能遇到的问题包括安装后仍然显示旧版本CUDA,这可能是因为环境变量没有正确设置,或者多个CUDA版本共存时需要切换版本。引用[2]提到解决安装CUDA 11.6却显示10.1的问题,可能需要通过软链接或更新环境变量来指向正确版本。 在整理步骤时,要确保每个环节都覆盖到,比如卸载旧驱动、禁用Nouveau、下载安装包、安装过程的选择(比如不安装驱动)、环境变量配置、验证步骤。同时,要提醒用户在安装过程中的注意事项,例如在安装时取消勾选驱动安装,如果已经安装了其他版本的驱动的话。 可能还需要考虑是否需要联网下载,或者是否有离线安装的方法。引用[2]和引用[3]提供了在线下载的方法,而引用[4]提到离线安装PyTorch,但CUDA本身可能还是需要在线下载安装包。不过用户的问题是关于CUDA安装,所以主要参考在线安装步骤。 最后,生成相关问题时要围绕CUDA安装可能涉及的步骤、常见问题、验证方法、版本切换等。例如,如何解决安装后的版本冲突,如何切换不同CUDA版本,如何验证安装是否成功等。 总结一下,步骤应该是: 1. 确认系统架构是x86_64。 2. 卸载旧版NVIDIA驱动。 3. 禁用Nouveau驱动。 4. 下载CUDA 11.6安装包。 5. 运行安装程序,注意不安装驱动(如果已有驱动的话)。 6. 配置环境变量。 7. 验证安装。 需要确保每一步都清晰,并提醒用户注意事项,如重启、避免驱动冲突等。</think>### 如何下载并安装 CUDA 11.6? #### 1. **确认系统架构** 在终端输入以下命令,确保系统为 `x86_64` 架构(若为其他架构需调整安装方式): ```bash uname -a ``` 输出示例:`Linux hostname 5.11.0-xx-generic #xx-Ubuntu SMP ... x86_64 x86_64 x86_64 GNU/Linux`[^1]。 #### 2. **卸载旧版 NVIDIA 驱动(如有冲突)** 若已安装旧版驱动,需彻底卸载以避免冲突: ```bash sudo apt-get --purge remove "*nvidia*" sudo apt-get autoremove sudo apt-get clean ``` #### 3. **禁用 Nouveau 驱动** Nouveau 是开源 NVIDIA 驱动,可能与 CUDA 冲突,需禁用: ```bash sudo bash -c "echo 'blacklist nouveau' > /etc/modprobe.d/blacklist-nouveau.conf" sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nouveau.conf" sudo update-initramfs -u sudo reboot # 重启生效 ``` #### 4. **下载 CUDA 11.6 安装包** 通过 `wget` 直接下载(或从官网手动下载): ```bash wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda_11.6.2_510.47.03_linux.run ``` #### 5. **安装 CUDA 11.6** 运行安装脚本并按提示操作: ```bash sudo sh cuda_11.6.2_510.47.03_linux.run ``` - **关键选项**:取消勾选 `Driver`(若已安装独立驱动),仅保留 `CUDA Toolkit`[^2]。 - 安装路径默认为 `/usr/local/cuda-11.6`。 #### 6. **配置环境变量** 将以下内容添加到 `~/.bashrc` 或 `~/.zshrc`: ```bash export PATH=/usr/local/cuda-11.6/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64:$LD_LIBRARY_PATH ``` 生效配置: ```bash source ~/.bashrc ``` #### 7. **验证安装** - **检查 CUDA 版本**: ```bash nvcc --version # 应输出 11.6 版本 ``` - **运行示例程序**: ```bash cd /usr/local/cuda-11.6/samples/1_Utilities/deviceQuery sudo make ./deviceQuery # 若显示 Result = PASS 则安装成功 ``` #### 8. **解决常见问题** - **安装后显示旧版本 CUDA**:检查环境变量是否指向 `/usr/local/cuda-11.6`,而非旧版本软链接。 - **版本切换**:通过修改软链接 `/usr/local/cuda` 指向所需版本[^3]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱吃油淋鸡的莫何

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值