conda install tensorflow-gpu

以上命令安装好tensorflow-gpu后,我遇到了这样的问题:

CUDA driver version is insufficient for CUDA runtime version

经过分析,我发现使用anaconda自动分析依赖安装的cudatoolkit的版本是CUDA 10.0 (10.0.130),而ubuntu装机自带的NVIDIA驱动版本是nvidia-38

使用如下命令查询Nvidia驱动版本:

nvidia-smi

使用如下命令查询cudatoolkit, cuda, cudnn版本:

conda list cudatoolkit
cat /usr/local/cuda/version.txt
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

英伟达官网给出的CUDA和驱动版本对应关系为:

CUDA Toolkit Linux x86_64 Driver Version
CUDA 10.2 (10.2.89) >= 440.33
CUDA 10.1 (10.1.105) >= 418.39
CUDA 10.0 (10.0.130) >= 410.48
CUDA 9.2 (9.2.88) >= 396.26
CUDA 9.1 (9.1.85) >= 390.46
CUDA 9.0 (9.0.76) >= 384.81
CUDA 8.0 (8.0.61 GA2) >= 375.26
CUDA 8.0 (8.0.44) >= 367.48
CUDA 7.5 (7.5.16) >= 352.31
CUDA 7.0 (7.0.28) >= 346.46

因此,我找到了nvidia-384对应的CUDA版本:CUDA 9.0 (9.0.76)

使用如下命令对CUDA进行降级即可解决问题:

conda install cudatoolkit=9.0 tensorflow-gpu

有时,你需要的cudatoolkit在默认channel里可能没有,使用如下命令安装其他channel里的对应版本:

conda install -c numba cudatoolkit=9.1 tensorflow-gpu

标签: none

评论已关闭