Перейти к основному содержимому

Модель оплаты и цены Foundation Models Catalog

Последнее изменение:

Баланс

Для оплаты ресурсов облачной платформы в зависимости от типа баланса в аккаунте используется единый баланс или баланс облачной платформы.

Оплатить ресурсы можно разными типами средств: основными средствами, бонусами.

Перед оплатой пополните баланс.

Модель оплаты

В облачной платформе используется модель оплаты pay-as-you-go. С баланса каждый час списываются средства за предыдущий час использования ресурсов облачной платформы.

Оплата ресурсов inference-сервиса формируется по проектам. Каждый проект содержит в себе группу ресурсов: количество GPU, vCPU, RAM, размер диска.

Каждый астрономический час стоимость группы ресурсов обновляется.

Все ресурсы облачной платформы для Foundation Models Catalog квотируются. Для квотируемых ресурсов учитывается максимальное потребление в течение часа.

примечание

Например, в 13:25 создан inference-сервис с двумя inference-инстансами. Конфигурация каждого inference-инстанса: 24 vCPU, 160 ГБ RAM, 1 GPU, 300 ГБ диск. В 13:40 inference-сервис масштабирован — уменьшено количество inference-инстансов до одного. В счете за час 13:00–14:00 учтется потребление 48 vCPU, 320 ГБ RAM, 2 GPU, 600 ГБ диска. За час 14:00–15:00 учтется потребление только 24 vCPU, 160 ГБ RAM, 1 GPU, 300 ГБ диска, если не увеличивалось количество inference-инстансов или не создавались другие inference-сервисы.

Если в проекте увеличилось количество inference-сервисов или количество inference-инстансов в inference-сервисе, оплата за ресурсы изменится сразу же.

примечание

Например, в 13:25 создан inference-сервис с одним inference-инстансом. Конфигурация inference-инстанса: 24 vCPU, 160 ГБ RAM, 1 GPU, 300 ГБ диск. В 13:40 inference-сервис масштабирован — увеличено количество inference-инстансов с одного до двух. За час 13:00–14:00 будут списаны средства за 48 vCPU, 320 ГБ RAM, 2 GPU, 600 ГБ диска.

Блокировка ресурсов, если на балансе недостаточно средств

Если на момент списания на балансе будет недостаточно средств для оплаты, то все ресурсы облачной платформы автоматически заблокируются — при этом за них продолжит начисляться плата.

Чтобы восстановить доступ к ресурсам, нужно пополнить баланс на сумму долга в течение 14 дней после блокировки. Долг за ресурсы, которые тарифицировались в период блокировки, автоматически погасится. Проекты не блокируются — можно удалить проект целиком или ресурсы через API.

Если в течение 14 дней после блокировки не пополнить баланс на сумму долга, все ресурсы облачной платформы удалятся. Проекты при этом не удаляются.

Чтобы на балансе всегда было достаточно денег, можно настроить уведомления о балансе и автопополнение баланса.

Цены

Стоимость зависит от выбранной конфигурации inference-сервиса. При использовании inference-сервиса вы платите только за ресурсы облачной платформы: GPU, vCPU, RAM, размер диска. Стоимость не зависит от количества токенов.

Цены на ресурсы можно посмотреть при создании inference-сервиса в панели управления.

Отчетные документы

После оплаты можно получить отчетные документы.