一、windows发现问题
‘nvidia-smi’ 不是内部或外部命令,也不是可运行的程序或批处理文件。
二、问题解决
1、NVIDIA驱动的默认安装路径是在:C:\Program Files\NVIDIA Corporation\NVSMI,将该路径添加到系统的环境变量中的Path中,再一路确定即可。
2、重新打开cmd窗口,输入nvidia-smi进行测试,成功显示即可,可以本机电脑的CUDA版本号。
注意:
win10系统高版本显卡驱动是不需要使用nvidia-smi.exe文件的,想要查看显卡占用率可以直接在命令行窗口输入:nvidia-smi
下载完cuda和cudnn后,nvidia-smi打不开了,打开任务管理器发现GPU消失了。
点击->此电脑->管理->设备管理器->往下拉有一个显示适配器->然后我发现上面有一个黄色感叹号->下载安装了最新的驱动,选择的第一个->然后再次输入nvidia-smi就好了
Ubuntu
NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
问题:
机器已经安装nvidia驱动,且正常使用,重启后找不到显卡驱动
打开终端,用nvidia-smi查看一下,发现如下报错:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
分析:
查看发现系统中的显卡驱动自动升级了,重启后没有正常找到驱动
解决:
第一步,使用nvcc -V检查驱动和cuda。
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Mar_21_19:15:46_PDT_2021
Cuda compilation tools, release 11.3, V11.3.58
Build cuda_11.3.r11.3/compiler.29745058_0
发现驱动是存在的,于是进行下一步
第二步,查看已安装驱动的版本信息
ls /usr/src | grep nvidia
比如我的驱动版本是:nvidia-545.23.08
第三步,依次输入以下命令
sudo apt-get install dkms
sudo dkms install -m nvidia -v 545.23.08
等待安装完成后,再次输入nvidia-smi,查看GPU使用状态:
最后,我们熟悉的页面又回来了!
第四步,本来到这就结束了,但发现显卡没被占用,但利用率却有:
问题:
执行以下命令,解决
sudo nvidia-smi -pm 1
如果是poman创建环境无法使用nvidia-smi命令
solution:
一般没有额外配置时在容器中执行nvidia-smi会报错无法识别该命令,原因在于少了配置(并不是要在容器中再次安装一次NVIDIA驱动)。
# 安装驱动