Установить драйверы для групп нод с GPU
Вы можете создать кластеры Managed Kubernetes с GPU без предустановленных драйверов. Чтобы самостоятельно установить драйвер, используйте приложение NVIDIA® GPU Operator.
-
Установите менеджер пакетов Helm версии 3.7.0 и выше.
-
Добавьте репозиторий
nvidia
в Helm:helm repo add nvidia https://helm.ngc.nvidia.com/nvidia
-
Обновите репозиторий
nvidia
в Helm:helm repo update
-
Установите NVIDIA GPU Operator и укажите драйвер GPU нужной версии:
helm install \
--namespace gpu-operator \
--create-namespace \
--set driver.version=<driver_version> \
gpu-operator nvidia/gpu-operatorУкажите
<driver_version>
— версия драйвера NVIDIA®. Можно посмотреть в строке NVIDIA GPU Driver, в таблице GPU Operator Component Matrix документации NVIDIA®. -
Чтобы проверить правильность установки NVIDIA GPU Operator и драйвера GPU, запустите GPU приложение. Например, приложение для сложения векторов CUDA VectorAdd:
cat << EOF | kubectl create -f -
apiVersion: v1
kind: Pod
metadata:
name: cuda-vectoradd
spec:
restartPolicy: OnFailure
containers:
- name: cuda-vectoradd
image: "nvidia/samples:vectoradd-cuda11.2.1"
resources:
limits:
nvidia.com/gpu: 1
EOF -
Проверьте, что приложение CUDA VectorAdd успешно завершено — статус пода должен быть
Completed
:kubectl get pods
В ответе у пода
cuda-vectoradd
будет статусCompleted
:NAME READY STATUS RESTARTS AGE
cuda-vectoradd 0/1 Completed 0 51s