Графические процессоры (GPU)

К облачному серверу можно добавить GPU (графические процессоры) при создании сервера или к существующему серверу.

GPU используются как выделенные PCI-устройства внутри облачного сервера.

Графические процессоры доступны в фиксированных и произвольных конфигурациях линейки GPU.

Конфигурации линейки GPU и произвольные конфигурации с GPU можно использовать с локальным или сетевым загрузочным диском. Для облачных серверов с локальным диском можно использовать только NVIDIA® A100 40Gb⁠⁠, NVIDIA® A100 80Gb⁠, NVIDIA® A30, NVIDIA® A5000 или NVIDIA® RTX 6000 Ada.

Если вам нужен сервер с набором преднастроенных инструментов и библиотек для машинного обучения и анализа данных, воспользуйтесь AI-маркетплейсом.

Доступные GPU

	Память	CUDA ядра	Тензорные ядра
NVIDIA® A100 40Gb NVIDIA® A100 40Gb NVLink (по запросу)	40 ГБ HBM2	6192	432
NVIDIA® A100 80Gb	80 ГБ HBM2	6912	432
NVIDIA® Tesla T4	16 ГБ GDDR6	2560	320
NVIDIA® A30	24 ГБ HBM2	3804	224
NVIDIA® A2 (обновленный аналог NVIDIA® Tesla T4)	16 ГБ GDDR6	1280	40
NVIDIA® GTX 1080	8 ГБ GDDR5X	2560	✗
NVIDIA® RTX 2080 Ti	11 ГБ GDDR6	4352	544
NVIDIA® RTX 4090	24 ГБ GDDR6X	16384	512
NVIDIA® RTX 6000 Ada (аналог L40)	48 ГБ GDDR6X	18176	568
NVIDIA® A2000 (аналог RTX 3060)	6 ГБ GDDR6	3328	104
NVIDIA® A5000 (аналог RTX 3080)	24 ГБ GDDR6	8192	256
NVIDIA® H100	80 ГБ HBM3	16896	528
NVIDIA® H200	141 ГБ HBM3e	16896	528
NVIDIA® L4	24 ГБ GDDR6	20480	640

Посмотреть актуальный список GPU можно в панели управления: в верхнем меню нажмите Продукты → Облачные серверы → нажмите Создать сервер.

Посмотреть доступность GPU в регионах можно в матрице доступности GPU для облачных серверов.

NVIDIA® A100 40Gb

Обладает максимальной производительностью для AI, HPC и обработки данных. Подходит для глубокого обучения, научных исследований и аналитики данных.

На базе архитектуры Ampere®, c памятью 40ГБ HBM2 и пропускной способностью до 1,5 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 8 GPU × 40 ГБ, при vCPU от 6 до 48, RAM от 87 до 700 ГБ.

В произвольных конфигурациях — от 1 до 8 GPU × 40 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A100 40Gb NVLink

Вы можете объединить два графических процессора NVIDIA® A100 40Gb с помощью технологии NVLink.

NVLink ускоряет скорость обмена данными при объединении GPU по сравнению с интерфейсом PCIe. Графические процессоры, объединенные NVLink, позволяют использовать больше памяти и повышают производительность сервера для выполнения сложных вычислений, например обучения больших языковых ML-моделей.

NVLink работает с NVIDIA® A100 40Gb — графические процессоры на базе архитектуры Ampere®, с памятью 40 ГБ HBM2 и пропускной способностью до 1,5 ГБ/с. Посмотрите подробные характеристики NVIDIA® A100 40Gb и описание технологии NVLink в документации NVIDIA®.

NVIDIA® A100 40Gb NVLink доступны по запросу — создайте тикет.

NVIDIA® A100 80Gb

Обладает максимальной производительностью для AI, HPC и обработки данных, а также большим объемом памяти для выполнения ресурсоемких задач. Подходит для глубокого обучения, научных исследований и аналитики данных.

На базе архитектуры Ampere®, с памятью 80 ГБ HBM2 и пропускной способностью до 1,5 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 8 GPU × 80 ГБ, при vCPU от 12 до 96, RAM от 128 до 1 000 ГБ и локальном диске от 128 ГБ до 6,88 ТБ.

В произвольных конфигурациях — от 1 до 8 GPU × 80 ГБ, при vCPU от 12 до 192, RAM от 64 ГБ до 1 000 ГБ и локальном диске от 256 ГБ до 3,36 ТБ.

NVIDIA® Tesla T4

Подходит для Machine Learning и Deep Learning, инференса, работы с графикой и рендерингом видео. Работает с большинством AI-фреймворков и совместима со всеми типами нейросетей.

На базе архитектуры Turing®, с памятью 16 ГБ GDDR6 и пропускной способностью до 300 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 4 до 24, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 16 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A30

Подходит для AI-инференса, HPC, обработки языка, разговорного искусственного интеллекта, рекомендательных систем.

На базе архитектуры Ampere®, с памятью 24 ГБ HBM2 и пропускной способностью до 933 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 16 до 48, RAM от 64 до 320 ГБ.

В произвольных конфигурациях — от 1 до 2 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A2

GPU для начального уровня. Подходит для простого инференса, видео и графики, Edge AI (периферийных вычислений), Edge-видео, мобильного облачного гейминга.

На базе архитектуры Ampere®, с памятью 16 ГБ GDDR6 и пропускной способностью до 200 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 12 до 48, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 16 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® GTX 1080

Производительный и энергоэффективный GPU. Решение реализовано с помощью технологии FinFET и памяти GDDR5X. Динамическая балансировка нагрузки помогает разделять задачи, чтобы ресурсы не простаивали в ожидании. Обладает максимальной производительностью для отображения информации, VR, параметров ультра высокого разрешения и обработки данных.

На базе архитектуры Pascal®, с памятью 8 ГБ GDDR5X и пропускной способностью до 320 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 8 GPU × 8 ГБ, при vCPU от 8 до 28, RAM от 24 до 96 ГБ.

В произвольных конфигурациях — от 1 до 8 GPU × 8 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® RTX 2080 Ti

Высокопроизводительный GPU для выполнения сложных графических задач. Подходит для обработки видео в высоком разрешении, создания 3D-моделей, рендеринга и обработки фотографий. Также подходит для обучения нейросетей, выполнения сложных вычислений в области искусственного интеллекта и обработки больших объемов данных.

На базе архитектуры Turing®, с памятью 11 ГБ GDDR6 и пропускной способностью до 616 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 48, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® RTX 4090

Самый производительный GPU серии GeForce. Подходит для профессионального проектирования и 3D-моделирования, работы с видео, рендеринга, ML-задач (обучения и инференса моделей), работы с языковыми моделями (LLM), научных и инженерных вычислений (например, в моделировании климата или биоинформатике).

На базе архитектуры Ada Lovelace®, с памятью 24 ГБ GDDR6X и пропускной способностью до 1008 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 24 ГБ, при vCPU от 4 до 64, RAM от 16 до 356 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 4 до 256 ГБ.

NVIDIA® RTX 6000 Ada

Профессиональный GPU для вычислительной и графической мощности. Подходит для ML-задач, рендеринга, научных вычислений и высокопроизводительной визуализации.

На базе архитектуры Ada Lovelace®, с памятью 48 ГБ GDDR6X и пропускной способностью до 960 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 48 ГБ, при vCPU от 12 до 96, RAM от 64 до 450 ГБ и локальном диске от 64 ГБ до 2 ТБ.

В произвольных конфигурациях — от 1 до 4 GPU × 48 ГБ, при vCPU от 12 до 96, RAM от 64 до 450 ГБ и локальном диске от 64 ГБ до 3,52 ТБ.

NVIDIA® A2000

Энергоэффективный GPU для компактных рабочих станций. Подходит для AI, графики и рендеринга видео.

На базе архитектуры Ampere®, с памятью 6 ГБ GDDR6 и пропускной способностью до 288 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 6 ГБ, при vCPU от 6 до 24, RAM от 16 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 6 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A5000

Универсальный GPU, подходит для любых задач в рамках своей производительности.

На базе архитектуры Ampere®, с памятью 24 ГБ GDDR6 и пропускной способностью до 768 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 4 GPU × 24 ГБ, при vCPU от 8 до 48, RAM от 16 до 450 ГБ и локальном диске от 100 ГБ до 2 ТБ.

В произвольных конфигурациях — от 1 до 2 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® H100

Мощный GPU, который подходит для AI, HPC и масштабируемых вычислений.

На базе архитектуры Hopper™, с памятью 80 ГБ HBM3 и пропускной способностью до 3 ТБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 2 GPU × 80 ГБ, при vCPU от 12 до 48, RAM от 128 до 256 ГБ.

В произвольных конфигурациях — от 1 до 2 GPU × 80 ГБ, при vCPU от 2 до 48, RAM от 2 ГБ до 256 ГБ.

NVIDIA® H200

Профессиональный GPU для ускорения генеративного AI, HPC, инференса больших языковых моделей (LLM), файн-тюнинга моделей, генерации изображений и видео.

На базе архитектуры Hopper™, с памятью 141 ГБ HBM3 и пропускной способностью до 4,8 ТБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных и произвольных конфигурациях линейки GPU доступно от 1 до 8 GPU × 141 ГБ, при vCPU от 12 до 192, RAM от 120 ГБ до 1 ТБ и локальном диске от 256 ГБ до 3 ТБ.

NVIDIA® L4

Универсальный GPU для ускорения AI/ML-рабочих нагрузок, обработки видео, стриминга и VDI. Подходит для запуска современных языковых моделей (LLM) и мультимодальных моделей.

На базе архитектуры Ada Lovelace®, с памятью 24 ГБ GDDR6 и пропускной способностью до 3 ТБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях линейки GPU доступно от 1 до 8 GPU × 24 ГБ, при vCPU от 8 до 128, RAM от 32 ГБ до 512 ГБ.

В произвольных конфигурациях — от 1 до 8 GPU × 24 ГБ, при vCPU от 8 до 256, RAM от 64 ГБ до 640 ГБ.

Создать облачный сервер с GPU

Используйте инструкцию Создать облачный сервер.

При создании сервера выберите:

источник — готовые образы c GPU-оптимизацией, которые отмечены в списке версий как GPU optimized. Образы содержат драйверы, необходимые для работы с графическими процессорами. Если выберете другой источник, для стабильной работы GPU NVIDIA® нужно установить драйверы на сервере самостоятельно;
конфигурацию — фиксированную или произвольную конфигурацию линейки GPU от 2 vCPU.