Введение / Зачем это нужно
CUDA Toolkit — это комплекс разработки от NVIDIA для создания высокопроизводительных приложений, использующих GPU. Установка CUDA на Linux — обязательный шаг для работы с фреймворками глубокого обучения (TensorFlow, PyTorch), научными вычислениями или любыми GPU-ускоренными задачами. Этот гайд проведёт вас через весь процесс: от проверки совместимости железа до успешной верификации установки.
Требования / Подготовка
Перед началом убедитесь, что:
- У вас есть видеокарта NVIDIA (GeForce, Quadro, Tesla и т.д.).
- Система обновлена:
sudo apt update(Debian/Ubuntu) илиsudo yum update(CentOS/RHEL). - Установлены базовые инструменты сборки:
sudo apt install build-essential(Debian/Ubuntu) илиsudo yum groupinstall "Development Tools"(CentOS/RHEL). - У вас есть права суперпользователя (
sudo).
⚠️ Важно: Версия драйверов NVIDIA должна быть совместима с версией CUDA Toolkit. Проверьте матрицу совместимости на официальном сайте NVIDIA. Установите драйверы до установки CUDA.
Пошаговая инструкция
Шаг 1: Определение модели видеокарты и версии драйвера
Откройте терминал и выполните команду:
lspci | grep -i nvidia
Вывод будет примерно таким: 01:00.0 VGA compatible controller: NVIDIA Corporation GA104 [GeForce RTX 3080] (rev a1). Запишите модель (например, GA104 или GeForce RTX 3080). Затем проверьте текущую версию драйвера:
nvidia-smi
Если команда не найдена, драйверы не установлены. Установите их через репозиторий NVIDIA или менеджер пакетов вашего дистрибутива. Для Ubuntu/Debian часто используется:
sudo apt install nvidia-driver-535 # Пример для драйвера 535
После установки драйверов перезагрузите систему.
Шаг 2: Добавление репозитория CUDA и установка
Самый надёжный способ — установка из официального репозитория NVIDIA. Перейдите на страницу загрузки CUDA, выберите ваш дистрибутив, архитектуру, версию и следуйте инструкциям по установке через терминал.
Пример для Ubuntu 22.04 (Jammy) с CUDA 12.1:
# 1. Добавление ключа репозитория
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
# 2. Обновление списка пакетов
sudo apt-get update
# 3. Установка CUDA Toolkit (метапакет)
sudo apt-get install cuda-12-1
Для CentOS/RHEL процесс аналогичен, но используются команды yum или dnf.
Шаг 3: Настройка переменных окружения
После установки необходимо добавить CUDA в системные пути. Откройте файл ~/.bashrc (для текущего пользователя) или /etc/profile.d/cuda.sh (для всех пользователей) в текстовом редакторе.
Добавьте в конец файла строки:
export PATH=/usr/local/cuda-12.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
💡 Совет: Версия в пути (
cuda-12.1) должна соответствовать установленной. Проверьте, создана ли символьная ссылка/usr/local/cudaна конкретную версию:ls -la /usr/local/cuda*.
Примените изменения без перезагрузки:
source ~/.bashrc
Шаг 4: Проверка и верификация установки
Выполните две ключевые команды для проверки:
- Проверка компилятора NVCC:
nvcc --version
Вывод должен показать версиюrelease 12.1(или другую, которую вы установили). - Проверка связи с драйвером и GPU:
nvidia-smi
Эта команда покажет информацию о GPU, версии драйвера и используемой версии CUDA (в верхнем правом углу). Убедитесь, что версия CUDA вnvidia-smiсовместима с установленным Toolkit.
Если обе команды работают, установка прошла успешно.
Возможные проблемы
- Ошибка
nvcc: command not found: ПеременнаяPATHне настроена или указана неверная версия CUDA. Выполнитеecho $PATHи убедитесь, что в выводе есть путь вида/usr/local/cuda-12.1/bin. Исправьте~/.bashrcи выполнитеsource ~/.bashrc. - Конфликт версий драйвера и CUDA: Если
nvidia-smiпоказывает версию CUDA, несовместимую с установленным Toolkit (например, драйвер 525, а CUDA 12.1 требует минимум 525.60.05), обновите драйверы черезsudo apt install nvidia-driver-535или аналогичную команду. - Ошибка зависимостей при установке: Убедитесь, что вы добавили репозиторий NVIDIA правильно. Попробуйте выполнить
sudo apt --fix-broken installили установите CUDA вручную, скачав.run-файл с сайта NVIDIA и запустив его с флагами--silent --toolkit. nvidia-smiне работает или показывает «No devices were found»: Проверьте, правильно ли установлены драйверы (lsmod | grep nvidia), не отключена ли видеокарта в BIOS/UEFI и работает ли она в Windows (если dual-boot).