logo

GPU 软件

wangzf / 2022-07-15


目录

Ubuntu

安装 Nvidia 显卡驱动

最简单的方式是通过系统的软件与更新来安装:

  1. 进入系统的图形桌面,打开 Software & Updates 软件,可以看到标签栏有一个 Additional Drivers:
    • NVIDIA Corporation: Unknown
      • Using NVIDIA dirver metapackage from nvidia-driver-455(proprietary, tested)
      • Using X.Org x server – Nouveau display driver from xserver-xorg-video-nouveau(open source)
    • 选择第一个安装 Nvidia 官方驱动(第二个是开源驱动)即可,根据网络情况稍等大概十分钟,安装完重启服务器。
  2. 重启完之后更新一下软件
sudo apt update
sudo apt upgrade

这里会连带 Nvidia 的驱动一起升级一遍,更新到最新的驱动; 更新完可能会出现 nvidia-smi 命令报错,再重启一遍就解决了

安装 CUDA

CUDA 介绍

NVIDIA CUDA 工具包提供了开发环境,可供创建经 GPU 加速的高性能应用。 借助 CUDA 工具包,可以在经 GPU 加速的嵌入式系统、台式工作站、企业数据中心、 基于云的平台和 HPC 超级计算机中开发、优化和部署应用。 此工具包中包含多个 GPU 加速库、多种调试和优化工具、 一个 C/C++ 编译器以及一个用于在主要架构(包括 x86、Arm 和 POWER) 上构建和部署应用的运行时库。

借助多 GPU 配置中用于分布式计算的多项内置功能, 科学家和研究人员能够开发出可从单个 GPU 工作站扩展到配置数千个 GPU 的云端设施的应用。

CUDA 安装

  1. 如果之前安装了旧版本的 CUDA 和 cudnn 的话,需要先卸载后再安装, 卸载 CUDA:
# sudo apt-get remove --purge nvidia

然后重新安装显卡驱动,安装好了之后开始安装 CUDA

  1. 下载 CUDA 安装包–CUDA Toolkit 11.0 Download|NVIDIA Developer

images

  1. 安装 CUDA
chmod +x cuda_11.0.2_450.51.05_linux.run
sudo sh ./cuda_11.0.2_450.51.05_linux.run
  1. 配置 UDA 环境变量
vim ~/.bashrc
# or
vim ~/.zsh

export CUDA_HOME=/usr/local/cuda-11.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin/${PATH}
source ~/.bashrc
  1. 查看安装的版本信息
nvcc -V

可以编译一个程序测试安装是否成功,执行以下几条命令:

cd ~/Softwares/cuda/NVIDIA_CUDA-11.0_Samples/1_Utilities/deviceQuery
make
./deviceQuery

安装 cuDNN

  1. 下载 cuDNN 安装包–cuDNN Download|NVIDIA Developer
  2. 安装 cuDNN
tar -xzvf cudnn-11.0-linux-x64-v8.0.5.39.tag
sudo cp cuda/lib64/* /usr/local/cuda-11.0/lib64/
sudo cp cuda/include/* /usr/local/cuda-11.0/include/
  1. 查看 cuDNN 的版本信息
$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

安装 PyTorch

PyTorch Org 安装

$ pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
$ conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

PyTorch GPU 支持测试

import torch
torch.cuda.is_available()

Windows

查看系统信息

安装 Nvidia 显卡驱动

安装 CUDA 和 cuDNN

安装 CUDA

安装 cuDNN

安装 PyTorch

$ pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
$ conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

参考