Перейти к основному содержимому
Мониторинг кластера, нод и баз данных Redis
Последнее изменение:

Мониторинг кластера, нод и баз данных Redis

В облачных базах данных Redis можно отслеживать состояние кластера.

Для оценки общего состояния кластера посмотрите его статус.

Для более детального анализа можно:

Узнать о том, что на диске скоро закончится место, можно с помощью уведомления о заполненности диска.

Посмотреть статус кластера

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.
  2. В строке кластера посмотрите статус.
ACTIVEКластер доступен
CREATINGКластер создается
UPDATINGК кластеру применяются изменения
RESIZINGКластер масштабируется
ERRORПроизошла ошибка, создайте тикет
DISK FULL

Диск заполнен, кластер работает только на чтение. Чтобы кластер работал на чтение и запись, масштабируйте кластер и выберите конфигурацию с бóльшим размером диска

DEGRADEDЧасть нод кластера недоступна
DELETINGКластер удаляется

Посмотреть состояние нод кластера

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.
  2. Откройте страницу кластера → вкладка Мониторинг.
  3. В блоке Мониторинг кластера нажмите Ноды кластера.
  4. В поле Сервер выберите ноду, метрики которой вы хотите посмотреть.
  5. Посмотрите доступные метрики нод кластера.

Метрики нод кластера в панели управления

vCPUНа сколько процентов загружены ядра нод кластера
CPU iowaitCколько процентов времени процессор потратил на ожидание ввода/вывода
ПамятьЗанятая память без учета кэша и буферов операционной системы в процентах или гигабайтах
ДискЗанятое место на диске в процентах или гигабайтах. Файловая система резервирует под служебные нужды 4% объема диска, поэтому занятое место больше реально используемого на эти 4%
Нагрузка сети

Количество бит или пакетов, отправленных и принятых через сетевой интерфейс

Диск, скорость чтения и записи

Скорость чтения данных в Б/с и записи данных в КБ/с

Диск, количество операций IOPS

Количество операций чтения и записи в секунду

OOM

Количество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти

Load Average

Среднее значение загрузки системы за период времени. Показывает, какое количество процессов обрабатывается ядрами кластера. Показатель представлен в виде трех значений — за одну минуту, пять минут и 15 минут. Эти значения должны быть не больше, чем количество ядер на ноде

Посмотреть состояние баз данных

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.
  2. Откройте страницу кластера → вкладка Мониторинг.
  3. В блоке Мониторинг кластера нажмите Базы данных.
  4. В поле Сервер выберите ноду, метрики которой вы хотите посмотреть.
  5. Посмотрите доступные метрики баз данных.

Метрики баз данных в панели управления

ПодключенияКоличество подключений к базам данных кластера
ЗапросыКоличество успешных и неудачных запросов в секунду. Неудачными считаются запросы, при которых ключ не существует, вытеснен из-за превышения лимита памяти или его срок жизни (TTL) истек
Количество ключейКоличество ключей во всех базах данных и количество ключей с заданным сроком жизни (TTL)
Вытесненные и устаревшие ключи

Отображается два параметра:

  • Evicted — количество ключей, вытесненных из-за превышения лимита памяти;
  • Expired — количество ключей с истекшим сроком жизни.
Медленные запросы

Количество медленных запросов в секунду. Медленными считаются запросы, которые выполняются дольше 0,01 секунды

Экспортировать метрики в формате Prometheus

  1. Получите токен.
  2. Получите метрики в формате Prometheus.

1. Получить токен

Токен дает доступ к метрикам всех кластеров проекта в одном пуле.

  1. В панели управления перейдите в раздел Облачная платформаБазы данных.

  2. Откройте страницу кластера → вкладка Мониторинг.

  3. В блоке Токены для Prometheus нажмите Добавить токен. Токен будет сгенерирован автоматически.

  4. Скопируйте токен. Для этого в строке токена нажмите .

2. Получить метрики в формате Prometheus

Историческая информация для кластеров недоступна — метрики запрашиваются только в режиме реального времени. Список всех метрик, которые поддерживаются в облачных базах данных, и их описание можно посмотреть в таблице Метрики в формате Prometheus.

  1. Добавьте в конфигурационный файл Prometheus:

    scrape_configs:
    - job_name: get-metrics-from-dbaas
    scrape_interval: 1m
    static_configs:
    - targets:
    - '<pool>.dbaas.selcloud.ru'
    scheme: https
    authorization:
    type: Bearer
    credentials: <monitoring_token>

    Укажите:

    • <pool> — пул, в котором действует токен, например ru-3. Адрес (URL) зависит от региона и пула, можно посмотреть в списке URL;
    • <monitoring_token> — токен мониторинга, который вы получили ранее.
  2. Откройте в браузере страницу, на которой будут доступны метрики в формате Prometheus:

    http://<ip_address>:9090/targets

    Укажите <ip_address> — IP-адрес, на котором установлен Prometheus.

  3. Самостоятельно настройте мониторинг и алерты для кластеров баз данных.

Метрики в формате Prometheus

Метрики в формате Prometheus предоставляются для всех кластеров. Конкретный кластер можно найти по идентификатору кластера базы данных в лейбле ds_id.

dbaas_memory_percentЗанятая память без учета кэша и буферов операционной системы (RAM) в процентах
dbaas_memory_bytesЗанятая память без учета кэша и буферов операционной системы (RAM) в байтах
dbaas_oom_countКоличество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти
dbaas_cpuИспользование vCPU на нодах кластера базы данных в процентах
dbaas_cpu_iowaitВремя ожидания ввода/вывода в процентах
dbaas_disk_percentЗанятое место на диске в процентах. Файловая система резервирует под служебные нужды 4% объема диска, поэтому занятое место больше реально используемого на эти 4%
dbaas_disk_bytesЗанятое место на диске в байтах. Файловая система резервирует под служебные нужды 4% объема диска, поэтому занятое место больше реально используемого на эти 4%
dbaas_disk_read_iopsКоличество операций чтения в секунду
dbaas_disk_write_iopsКоличество операций записи в секунду
dbaas_disk_read_bytesСкорость чтения данных с диска в байтах в секунду
dbaas_disk_write_bytesСкорость записи данных на диск в байтах в секунду
dbaas_node_load1Среднее значение загрузки системы за одну минуту. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load5Среднее значение загрузки системы за пять минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load15Среднее значение загрузки системы за 15 минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_network_receive_bytesКоличество байт, принятых через сетевой интерфейс
dbaas_network_transmit_bytesКоличество байт, отправленных через сетевой интерфейс
dbaas_network_receive_packetsКоличество пакетов, принятых через сетевой интерфейс в секунду
dbaas_network_transmit_packetsКоличество пакетов, отправленных через сетевой интерфейс в секунду
dbaas_role

Роль ноды:

  • 0 — роль неизвестна;
  • 1 — мастер;
  • 2 — реплика

Уведомления о заполненности диска

Если диск кластера будет заполнен на 80%, уведомление появится в панели управления и будет отправлено на электронную почту Владельца аккаунта и тех пользователей, которые подписаны на категорию уведомлений «Услуги и сервисы».

Если диск кластера будет заполнен на 95% и более, кластер перейдет в статус DISK_FULL и будет работать только на чтение. Чтобы кластер работал на чтение и запись, масштабируйте кластер и выберите конфигурацию с бóльшим размером диска.