Создать кластер Managed Kubernetes с GPU
Cоздание кластера Managed Kubernetes с GPU недоступно в кластерах Managed Kubernetes на выделенном сервере.
К кластеру Managed Kubernetes на облачном сервере можно добавить GPU (графические процессоры) — при создании кластера Managed Kubernetes на облачном сервере или добавлении группы нод на облачном сервере.
Посмотреть доступность GPU в регионах можно в матрице доступности GPU для Managed Kubernetes.
На нодах с GPU можно использовать предустановленные драйверы или установить драйверы самостоятельно. Для групп нод с GPU без драйверов недоступно автоматическое масштабирование кластера.
Создать кластер с GPU
Используйте инструкцию Создать кластер Managed Kubernetes на облачном сервере.
Выберите:
- конфигурацию — фиксированную конфигурацию группы нод с GPU;
- драйверы GPU — по умолчанию тумблер Драйверы GPU включен и в кластере используются предустановленные драйверы. Чтобы установить драйверы GPU самостоятельно, отключите тумблер Драйверы GPU.
Доступные GPU
Посмотреть актуальный список GPU можно в панели управления в разделе Облачная платформа → Kubernetes → нажмите Создать кластер → блок Конфигурация ноды → Фиксированная с GPU.
Посмотреть доступность GPU в регионах можно в матрице доступности GPU для Managed Kubernetes.
NVIDIA® A100
Обладает максимальной производительностью для AI, HPC и обработки данных. Подходит для глубокого обучения, научных исследований и аналитики данных.
На базе архитектуры Ampere®, пропускная способность до 2 ТБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 40 ГБ, при vCPU от 6 до 48, RAM от 87 до 704 ГБ.
NVIDIA® Tesla T4
Подходит для Machine Learning и Deep Learning, инференса, работы с графикой и рендерингом видео. Работает с большинством AI-фреймворков и совместима со всеми типами нейросетей.
На базе архитектуры Turing®, пропускная способность до 300 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 4 до 24, RAM от 32 до 320 ГБ.
NVIDIA® A30
Подходит для AI-инференса, HPC, обработки языка, разговорного искусственного интеллекта, рекомендательных систем.
На базе архитектуры Ampere®, пр опускная способность до 933 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 16 до 48, RAM от 64 до 320 ГБ.
NVIDIA® A2
GPU для начального уровня. Подходит для простого инференса, видео и графики, Edge AI (периферийных вычислений), Edge-видео, мобильного облачного гейминга.
На базе архитектуры Ampere®, пропускная способность до 200 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 12 до 48, RAM от 32 до 320 ГБ.
NVIDIA® GTX 1080
Производительный и энергоэффективный GPU. Решение реализовано с помощью технологии FinFET и памяти GDDR5X. Динамическая балансировка нагрузки помогает разделять задачи, чтобы ресурсы не простаивали в ожидании. Обладает максимальной производительностью для отображения информации, VR, параметров ультра высокого разрешения и обработки данных.
На базе архитектуры Pascal®, пропускная способность до 320 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 8 GPU × 8 ГБ, при vCPU от 8 до 28, RAM от 24 до 96 ГБ.
NVIDIA® RTX 2080 Ti
Высокопроизводительный GPU для выполнения сложных графических задач. Подходит для обработки видео в высоком разрешении, создания 3D-моделей, рендеринга и обработки фотографий. Также подходит для обучения нейросетей, выполнения сложных вычислений в области искусственного интеллекта и обработки больших объемов данных.
На базе архитектуры Turing®, пропускная способность до 616 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 48, RAM от 32 до 320 ГБ.
NVIDIA® RTX 4090
Самый производительный GPU серии GeForce. Подходит для профессионального проектирования и 3D-моделирования, работы с видео, рендеринга, ML-задач (обучения и инференса моделей), работы с LLM-моделями, научных и инженерных вычислений (например, в моделировании климата или биоинформатике).
На базе архитектуры Ada Lovelace®, пропускная способность до 1008 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 24 ГБ, при vCPU от 4 до 64, RAM от 16 до 356 ГБ.
NVIDIA® A2000
Энергоэффективный GPU для компактных рабочих станций. Подойдет для AI, графики и рендеринга видео.
На базе архитектуры Ampere®, пропускная способность д о 288 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 4 GPU × 6 ГБ, при vCPU от 6 до 24, RAM от 16 до 320 ГБ.
NVIDIA® A5000
Универсальный GPU, подходит для любых задач в рамках своей производительности.
На базе архитектуры Ampere®, пропускная способность до 768 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.
В фиксированных конфигурациях кластера Managed Kubernetes доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 8 до 48, RAM от 32 до 320 ГБ.