Перейти к основному содержимому
Мониторинг кластера и нод Kafka
Последнее изменение:

Мониторинг кластера и нод Kafka

Вы можете отслеживать состояние кластера Kafka в панели управления:

Метрики нод кластера и баз данных можно также экспортировать в формате Prometheus.

Посмотреть состояние нод кластера

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.
  2. Откройте страницу кластера → вкладка Мониторинг.
  3. В блоке Мониторинг серверов кластера посмотрите доступные метрики нод кластера.

Метрики нод кластера в панели управления

vCPUНа сколько процентов загружены ядра нод кластера
Load Average

Среднее значение загрузки системы за период времени. Показывает, какое количество процессов обрабатывается ядрами кластера. Показатель представлен в виде трех значений — за одну минуту, пять минут и 15 минут. Эти значения должны быть не больше, чем количество ядер на ноде.

ПамятьЗанятая память без учета кэша и буферов операционной системы в процентах или гигабайтах
ДискЗанятое место на диске в процентах или гигабайтах

Посмотреть статус кластера

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.
  2. Посмотрите статус в строке кластера → столбец Статус.
ACTIVEКластер доступен
CREATINGКластер создается
UPDATINGК кластеру применяются изменения
RESIZINGКластер масштабируется
ERRORПроизошла ошибка, создайте тикет
DISK FULL

Диск заполнен, кластер работает только на чтение. Чтобы кластер работал на чтение и запись, очистите диск или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска

DEGRADEDЧасть нод кластера недоступна
DELETINGКластер удаляется

Уведомления о заполненности диска

Если диск кластера будет заполнен на 80%, на почту аккаунта автоматически отправится уведомление.

Если диск кластера будет заполнен на 95% и более, кластер перейдет в статус DISK_FULL и будет работать только на чтение. Чтобы кластер работал на чтение и запись, очистите диск или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска.

Очистить диск

Откройте транзакцию transaction_read_only = no и удалите ненужные данные с помощью одного из запросов:

  • DROP TABLE — удаляет структуру (данные, привилегии, индексы, constraints, триггеры). Используйте при полном удалении таблицы с данными и структурой:

    BEGIN;
    SET transaction_read_only = no;
    DROP TABLE table_name;
    COMMIT;
  • TRUNCATE TABLE — удаляет содержимое таблицы, при этом структура сохраняется. Работает быстрее DROP TABLE. Используйте при удалении всех строк таблицы с сохранением структуры таблицы:

    BEGIN;
    SET transaction_read_only = no;
    TRUNCATE TABLE table_name;
    COMMIT;
  • DELETE — используйте для удаления определенных строк.

    к сведению

    Мы не рекомендуем использовать запрос DELETE FROM table WHERE ... для очистки диска. Этот запрос может создавать выборки больших размеров на больших таблицах и располагать их на диске. Оставшееся свободное место на диске может полностью закончиться, это приведет к проблемам с Kafka и необходимости восстанавливать его работу вручную.

Экспортировать метрики в формате Prometheus

Вы можете экспортировать метрики в формате Prometheus и затем самостоятельно настроить мониторинг и алерты для кластеров Kafka. Историческая информация для кластеров недоступна — метрики запрашиваются только в режиме реального времени.

Чтобы экспортировать метрики, нужно получить токен мониторинга. Токен дает доступ к метрикам всех кластеров в одном пуле проекта.

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.

  2. Откройте страницу кластера → вкладка Мониторинг.

  3. В блоке Метрики в формате Prometheus нажмите Управлять токенами.

  4. Нажмите Создать.

  5. Введите имя токена.

  6. Нажмите Создать. Токен будет сгенерирован автоматически.

  7. Добавьте в конфигурационный файл Prometheus:

    scrape_configs:
    - job_name: get-metrics-from-dbaas
    scrape_interval: 1m
    static_configs:
    - targets:
    - '<pool>.dbaas.selcloud.ru'
    scheme: https
    authorization:
    type: Bearer
    credentials: <monitoring_token>

    Укажите:

    • <pool> — пул, в котором действует токен, например ru-3. Адрес (URL) зависит от региона и пула, можно посмотреть в списке URL;
    • <monitoring_token> — значение токена мониторинга.
  8. Источник метрик появится по адресу http://<localhost>:9090/targets.

    Укажите <localhost> — IP-адрес, на котором установлен Prometheus.

  9. Посмотрите доступные метрики в формате Prometheus.

Метрики в формате Prometheus

Метрики в формате Prometheus предоставляются для всех кластеров. Конкретный кластер можно найти по идентификатору кластера базы данных в лейбле ds_id.

dbaas_memory_percentЗанятая память без учета кэша и буферов операционной системы (RAM) в процентах
dbaas_memory_bytesЗанятая память без учета кэша и буферов операционной системы (RAM) в байтах
dbaas_cpuИспользование ядер процессора (CPU) на нодах кластера базы данных в процентах
dbaas_cpu_iowaitВремя ожидания ввода/вывода в процентах
dbaas_disk_percentЗанятое место на диске в процентах
dbaas_disk_bytesЗанятое место на диске в байтах
dbaas_disk_read_iopsКоличество операций чтения в секунду
dbaas_disk_write_iopsКоличество операций записи в секунду
dbaas_disk_read_bytesСкорость чтения данных с диска в байтах в секунду
dbaas_disk_write_bytesСкорость записи данных на диск в байтах в секунду
dbaas_node_load1Среднее значение загрузки системы за одну минуту. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load5Среднее значение загрузки системы за пять минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load15Среднее значение загрузки системы за 15 минут. Показывает, какое количество процессов обрабатывается ядрами кластера
network_receive_bitsКоличество бит, принятых через сетевой интерфейс
network_transmit_bitsКоличество бит, отправленных через сетевой интерфейс
network_receive_packetsКоличество пакетов, принятых через сетевой интерфейс в секунду
network_transmit_packetsКоличество пакетов, отправленных через сетевой интерфейс в секунду