Перейти к основному содержимому
Установить драйверы для групп нод с GPU
Последнее изменение:

Установить драйверы для групп нод с GPU

Вы можете создать кластеры Managed Kubernetes с GPU без предустановленных драйверов. Чтобы самостоятельно установить драйвер, используйте приложение NVIDIA® GPU Operator.

  1. Подключитесь к кластеру.

  2. Установите менеджер пакетов Helm версии 3.7.0 и выше.

  3. Добавьте репозиторий nvidia в Helm:

    helm repo add nvidia https://helm.ngc.nvidia.com/nvidia
  4. Обновите репозиторий nvidia в Helm:

    helm repo update
  5. Установите NVIDIA GPU Operator и укажите драйвер GPU нужной версии:

    helm install \
    --namespace gpu-operator \
    --create-namespace \
    --set driver.version=<driver_version> \
    gpu-operator nvidia/gpu-operator

    Укажите <driver_version> — версия драйвера NVIDIA®. Можно посмотреть в строке NVIDIA GPU Driver, в таблице GPU Operator Component Matrix документации NVIDIA®.

  6. Чтобы проверить правильность установки NVIDIA GPU Operator и драйвера GPU, запустите GPU приложение. Например, приложение для сложения векторов CUDA VectorAdd:

    cat << EOF | kubectl create -f -
    apiVersion: v1
    kind: Pod
    metadata:
    name: cuda-vectoradd
    spec:
    restartPolicy: OnFailure
    containers:
    - name: cuda-vectoradd
    image: "nvidia/samples:vectoradd-cuda11.2.1"
    resources:
    limits:
    nvidia.com/gpu: 1
    EOF
  7. Проверьте, что приложение CUDA VectorAdd успешно завершено — статус пода должен быть Completed:

    kubectl get pods

    В ответе у пода cuda-vectoradd будет статус Completed:

    NAME                                  READY   STATUS        RESTARTS   AGE
    cuda-vectoradd 0/1 Completed 0 51s