Перейти к основному содержимому

Пример подключения к inference-сервису из Open WebUI

Последнее изменение:

Цель подключения

Подключиться к inference-сервису из Open WebUI через выделенный эндпоинт, чтобы взаимодействовать с моделью через чат-бот.

Что нужно для подключения

  • inference-сервис;

  • Open WebUI Virtual Machine из AI-маркетплейса с конфигурацией:

    • без графического процессора (GPU);
    • в приватной подсети с одним публичным IP-адресом для доступа из интернета.

Результат подключения

Open WebUI подключен к inference-сервису через выделенный эндпоинт, что позволяет взаимодействовать с моделью через чат-бот.

Шаги подключения

  1. Создайте аккаунт администратора в Open WebUI.
  2. Запустите Open WebUI.
  3. Подключите эндпоинт в Open WebUI.
  4. Отправьте тестовый запрос к модели.

1. Создать аккаунт администратора

Чтобы работать в веб-интерфейсе Open WebUI, сначала создайте аккаунт администратора.

  1. В панели управления в верхнем меню нажмите Продукты и выберите AI-маркетплейс.

  2. В карточке Open WebUI Virtual Machine нажмите Перейти в GUI.

  3. В веб-интерфейсе Open WebUI нажмите Давайте начнем.

  4. Введите имя пользователя.

  5. Введите электронную почту.

  6. Введите пароль.

  7. Нажмите Создать аккаунт Администратора.

2. Запустить Open WebUI

  1. В панели управления в верхнем меню нажмите Продукты и выберите AI-маркетплейс.

  2. В карточке Open WebUI Virtual Machine нажмите Перейти в GUI.

  3. Введите электронную почту администратора.

  4. Введите пароль администратора.

  5. Нажмите Войти.

3. Подключить эндпоинт в Open WebUI

  1. В веб-интерфейсе Open WebUI нажмите на иконку профиля и выберите Панель администратора.

  2. Откройте вкладку Настройки.

  3. Перейдите в раздел Подключения.

  4. Включите тумблер Прямые подключения.

  5. Нажмите Сохранить.

  6. На главной странице веб-интерфейса Open WebUI нажмите на иконку профиля и выберите Настройки.

  7. Перейдите в раздел Подключения.

  8. В строке Управление прямыми подключениями нажмите .

  9. В поле URL введите эндпоинт:

    https://<inference_service_uuid>.wc.<pool>.inference.selcloud.ru/v1

    Укажите:

    • <inference_service_uuid> — UUID inference-сервиса. UUID можно скопировать в панели управления: в верхнем меню нажмите ПродуктыInference-сервисы → в меню inference-сервиса выберите Скопировать UUID;

    • <pool> — пул, в котором создан inference-сервис, например ru-7.

  10. В поле Bearer введите API-ключ. API-ключ можно скопировать в панели управления: в верхнем меню нажмите ПродуктыInference-сервисы → страница inference-сервиса → вкладка API-ключи → в строке API-ключа нажмите , а затем .

  11. В поле IDs модели введите название модели и нажмите . Название модели можно посмотреть в панели управления: в верхнем меню нажмите ПродуктыInference-сервисы → страница inference-сервиса → вкладка Сервис → строка Модель.

  12. Нажмите Сохранить.

4. Отправить тестовый запрос к модели

  1. В веб-интерфейсе Open WebUI нажмите Выберите модель.

  2. Выберите модель, которую вы добавили на шаге 8 при подключении эндпоинта в Open WebUI.

  3. На главной странице веб-интерфейса Open WebUI нажмите на иконку профиля и выберите Настройки.

  4. Перейдите в раздел Общие.

  5. В блоке Расширенные параметры установите для параметра max_tokens значение 5 000.

  6. Нажмите Сохранить.

  7. Введите тестовый запрос, например:

    Привет!
  8. Нажмите .

  9. Дождитесь ответа модели.