3.0 KiB
3.0 KiB
本文作者丁辉
GPU容器化基础环境准备
Linux下载并安装GPU驱动(根据自身环境情况而定)
安装 NVIDIA 驱动程序 nvidia-container-toolkit
-
Centos
配置生产存储库
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \ tee /etc/yum.repos.d/nvidia-container-toolkit.repo
配置存储库以使用实验包(可选)
yum-config-manager --enable nvidia-container-toolkit-experimental
安装 NVIDIA Container Toolkit 软件包
yum install -y nvidia-container-toolkit
-
Ubuntu
配置生产存储库
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
配置存储库以使用实验包(可选)
sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
安装 NVIDIA Container Toolkit 软件包
apt-get update && apt-get install -y nvidia-container-toolkit
容器对接GPU
以 Docker 运行时举例
-
使用
nvidia-ctk
修改配置文件nvidia-ctk runtime configure --nvidia-set-as-default
无需担心此命令会覆盖源有的配置文件内容, 它只会通过修改来改变你当前的配置文件内容
参数解释
参数 描述 使用 --runtime=
指定当前容器运行时: docker,containerd,crio 等(默认会自动选择当前容器运行时) nvidia-ctk runtime configure --runtime=docker
--config=
指定容器运行时的配置文件的位置 nvidia-ctk runtime configure --config=/etc/docker/daemon.json
--nvidia-set-as-default
指定 NVIDIA 容器运行时作为默认运行时 nvidia-ctk runtime configure --nvidia-set-as-default
-
重启服务
systemctl restart docker
-
测试
docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi
查看是否成功打印 GPU 信息