Перейти к основному содержимому
Создать облачный сервер с GPU
Последнее изменение:

Создать облачный сервер с GPU

К облачному серверу можно добавить GPU (графические процессоры) — при создании сервера или к существующему серверу.

GPU используются как выделенные PCI-устройства внутри облачного сервера.

Графические процессоры доступны:

Линейку GPU Line и произвольные конфигурации с GPU можно использовать с локальным или сетевым загрузочным диском. Для облачных серверов с локальным диском можно использовать только NVIDIA® A100⁠ или NVIDIA® A30 в сегменте пула ru-7a.

Создать сервер с GPU

Используйте инструкцию Создать облачный сервер.

Выберите:

  • источник — готовый образ Ubuntu 22.04 LTS Machine Learning 64-bit. Образ содержит драйверы, необходимые для работы с графическими процессорами. Если выберете другой источник, для стабильной работы GPU NVIDIA® нужно установить драйверы на сервере самостоятельно;
  • конфигурацию — фиксированную конфигурацию линейки GPU Line или произвольную конфигурацию от 2 vCPU.

Добавить GPU к существующему облачному серверу

Если у облачного сервера произвольная конфигурация, к нему можно добавить графические процессоры.

Для облачных серверов с локальным диском можно добавить только NVIDIA® A100⁠ или NVIDIA® A30 в сегменте пула ru-7a.

  1. В панели управления перейдите в раздел Облачная платформаСерверы.
  2. Откройте страницу сервера → вкладка Конфигурация.
  3. Нажмите Изменить конфигурацию.
  4. Убедитесь, что в блоке Изменение конфигурации выбрана произвольная конфигурация.
  5. Нажмите Добавить GPU. Если у сервера 1 vCPU, значение автоматически изменится на 2 vCPU.
  6. Выберите тип GPU.
  7. Укажите количество GPU.
  8. Нажмите Сохранить и перезагрузить.
  9. Если сервер создан не из готового образа Ubuntu 22.04 LTS Machine Learning 64-bit с драйверами, для стабильной работы GPU NVIDIA® установите драйверы на сервере самостоятельно.

Доступные GPU

NVIDIA® A100

NVIDIA® A100 NVLink (по запросу)
NVIDIA® Tesla T4NVIDIA® A30NVIDIA® A2
(обновленный аналог
NVIDIA® Tesla T4)
NVIDIA® GTX 1080NVIDIA® RTX 2080 TiNVIDIA® RTX 4090NVIDIA® A2000
(аналог RTX 3060)
NVIDIA® A5000
(аналог RTX 3080)
Память40 ГБ
HBM2
16 ГБ
GDDR6
24 ГБ
HBM2
16 ГБ
GDDR6
8 ГБ
GDDR5X
11 ГБ
GDDR6
24 ГБ
GDDR6X
6 ГБ
GDDR6
24 ГБ
GDDR6
CUDA ядра6192256038041280256043521638433288192
Тензорные ядра43232022440544512104256

Посмотреть актуальный список GPU можно в панели управления: в разделе Облачная платформаСерверы → нажмите Создать сервер.

Посмотреть доступность GPU в регионах можно в матрице доступности GPU для облачных серверов.

NVIDIA® A100

Обладает максимальной производительностью для AI, HPC и обработки данных. Подходит для глубокого обучения, научных исследований и аналитики данных.

На базе архитектуры Ampere®, пропускная способность до 2 ТБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 8 GPU × 40 ГБ, при vCPU от 6 до 48, RAM от 87 до 700 ГБ.

В произвольных конфигурациях — от 1 до 8 GPU × 40 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

Вы можете объединить два графических процессора NVIDIA® A100 с помощью технологии NVLink.

NVLink ускоряет скорость обмена данными при объединении GPU по сравнению с интерфейсом PCIe. Графические процессоры, объединенные NVLink, позволяют использовать больше памяти и повышают производительность сервера для выполнения сложных вычислений, например обучения больших языковых ML-моделей.

NVLink работает с NVIDIA® A100 — графические процессоры на базе архитектуры Ampere® с пропускной способностью до 2 ТБ/с. Посмотрите подробные характеристики NVIDIA® A100 и описание технологии NVLink в документации NVIDIA®.

NVIDIA® A100 NVLink доступны по запросу — создайте тикет.

NVIDIA® Tesla T4

Подходит для Machine Learning и Deep Learning, инференса, работы с графикой и рендерингом видео. Работает с большинством AI-фреймворков и совместима со всеми типами нейросетей.

На базе архитектуры Turing®, пропускная способность до 300 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 4 до 24, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 16 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A30

Подходит для AI-инференса, HPC, обработки языка, разговорного искусственного интеллекта, рекомендательных систем.

На базе архитектуры Ampere®, пропускная способность до 933 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 16 до 48, RAM от 64 до 320 ГБ.

В произвольных конфигурациях — от 1 до 2 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A2

GPU для начального уровня. Подходит для простого инференса, видео и графики, Edge AI (периферийных вычислений), Edge-видео, мобильного облачного гейминга.

На базе архитектуры Ampere®, пропускная способность до 200 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 4 GPU × 16 ГБ, при vCPU от 12 до 48, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 16 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® GTX 1080

Производительный и энергоэффективный GPU. Решение реализовано с помощью технологии FinFET и памяти GDDR5X. Динамическая балансировка нагрузки помогает разделять задачи, чтобы ресурсы не простаивали в ожидании. Обладает максимальной производительностью для отображения информации, VR, параметров ультра высокого разрешения и обработки данных.

На базе архитектуры Pascal®, пропускная способность до 320 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 8 GPU × 8 ГБ, при vCPU от 8 до 28, RAM от 24 до 96 ГБ.

В произвольных конфигурациях — от 1 до 8 GPU × 8 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® RTX 2080 Ti

Высокопроизводительный GPU для выполнения сложных графических задач. Подходит для обработки видео в высоком разрешении, создания 3D-моделей, рендеринга и обработки фотографий. Также подходит для обучения нейросетей, выполнения сложных вычислений в области искусственного интеллекта и обработки больших объемов данных.

На базе архитектуры Turing®, пропускная способность до 616 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 48, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 11 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® RTX 4090

Самый производительный GPU серии GeForce. Подходит для профессионального проектирования и 3D-моделирования, работы с видео, рендеринга, ML-задач (обучения и инференса моделей), работы с LLM-моделями, научных и инженерных вычислений (например, в моделировании климата или биоинформатике).

На базе архитектуры Ada Lovelace®, пропускная способность до 1008 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 4 GPU × 24 ГБ, при vCPU от 4 до 64, RAM от 16 до 356 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 4 до 256 ГБ.

NVIDIA® A2000

Энергоэффективный GPU для компактных рабочих станций. Подойдет для AI, графики и рендеринга видео.

На базе архитектуры Ampere®, пропускная способность до 288 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 4 GPU × 6 ГБ, при vCPU от 6 до 24, RAM от 16 до 320 ГБ.

В произвольных конфигурациях — от 1 до 4 GPU × 6 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.

NVIDIA® A5000

Универсальный GPU, подходит для любых задач в рамках своей производительности.

На базе архитектуры Ampere®, пропускная способность до 768 ГБ/с. Посмотрите подробные характеристики в документации NVIDIA®.

В фиксированных конфигурациях GPU Line доступно от 1 до 2 GPU × 24 ГБ, при vCPU от 8 до 48, RAM от 32 до 320 ГБ.

В произвольных конфигурациях — от 1 до 2 GPU × 24 ГБ, при vCPU от 2 до 32, RAM от 512 МБ до 256 ГБ.