Перейти к основному содержимому

Мониторинг кластера, нод и баз данных PostgreSQL

Последнее изменение:

В облачных базах данных PostgreSQL вы можете отслеживать состояние кластера.

Для оценки общего состояния кластера посмотрите его статус.

Для более детального анализа некоторые метрики можно посмотреть в виде графиков в панели управления:

Полный набор доступных метрик можно экспортировать в формате Prometheus.

При анализе графиков учитывайте, что время в панели управления соответствует времени на вашем устройстве и не зависит от региона, где размещен кластер.

примечание

Например, вы создали кластер в Ташкенте, в пуле uz-1. На устройстве, с которого вы зашли в панель управления, установлен часовой пояс Москвы. Время на графиках метрик будет отображаться в часовом поясе Москвы.

Посмотреть статус кластера

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.

  2. Откройте вкладку Активные.

  3. В строке кластера посмотрите статус.

    ACTIVEКластер доступен
    CREATINGКластер создается
    UPDATINGКластер обновляется
    RESIZINGКластер масштабируется
    ERRORПроизошла ошибка, создайте тикет
    DISK FULL

    Диск заполнен, кластер работает только на чтение. Чтобы кластер работал на чтение и запись, очистите диск или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска

    DEGRADEDЧасть нод кластера недоступна
    DELETINGКластер удаляется

Посмотреть состояние нод кластера

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.
  2. Откройте вкладку Активные.
  3. Откройте страницу кластера → вкладка Мониторинг.
  4. В блоке Мониторинг кластера нажмите Ноды кластера.
  5. Выберите ноды, метрики которых хотите посмотреть.
  6. Посмотрите доступные метрики нод кластера.

Метрики нод кластера в панели управления

ПамятьЗанятая память без учета кэша и буферов операционной системы в процентах или гигабайтах
vCPUНа сколько процентов загружены ядра нод кластера
CPU iowaitCколько процентов времени процессор потратил на ожидание ввода/вывода
Диск

Занятое место на диске в процентах или гигабайтах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере PostgreSQL

Load Average

Среднее значение загрузки системы за период времени. Показывает, какое количество процессов обрабатывается ядрами кластера. Показатель представлен в виде трех значений — за одну минуту, пять минут и 15 минут. Эти значения должны быть не больше, чем количество ядер на ноде

OOM

Количество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти

Нагрузка диска

Скорость чтения и записи данных в КБ/с или количество операций чтения и записи в секунду

Нагрузка сетиКоличество бит или пакетов, отправленных и принятых через сетевой интерфейс

Посмотреть состояние баз данных

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.
  2. Откройте вкладку Активные.
  3. Откройте страницу кластера → вкладка Мониторинг.
  4. В блоке Мониторинг кластера нажмите Базы данных.
  5. Выберите ноды, метрики которых хотите посмотреть.
  6. Посмотрите доступные метрики баз данных.

Метрики баз данных в панели управления

Размер файла статистикиОбщий размер файла статистики в килобайтах
Попадание в кэшКакой процент данных в запросе был прочитан из кэша — отношение blks_hit к сумме blks_hit и blks_read
Операции со строками

Количество строк, затронутых операциями в выбранной базе данных в секунду:

  • tup_deleted — количество строк, удаленных операциями в секунду;
  • tup_fetched — количество строк, извлеченных операциями в секунду;
  • tup_inserted — количество строк, вставленных операциями в секунду;
  • tup_returned — количество строк, возвращенных операциями в секунду;
  • tup_updated — количество строк, обновленных операциями в секунду
LocksКоличество блокировок в каждой базе данных кластера
DeadlocksКоличество взаимных блокировок в каждой базе данных
ТранзакцииКоличество транзакций в секунду в каждой базе данных кластера
ПодключенияКоличество подключений к каждой базе данных кластера и суммарное количество подключений ко всем базам данных
Размер временных файловОбщий размер временных файлов в килобайтах
Размер WAL-файловОбщий размер WAL-файлов в мегабайтах
Время выполнения самого долгого запросаВремя выполнения самого долгого запроса в каждой базе данных кластера за период времени
Размер БДОбщий размер выбранной базы данных в мегабайтах

Посмотреть состояние пулера соединений

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.
  2. Откройте вкладку Активные.
  3. Откройте страницу кластера → вкладка Мониторинг.
  4. В блоке Мониторинг кластера нажмите Пулер соединений.
  5. Выберите ноды, метрики которыхой вы хотите посмотреть.
  6. Посмотрите доступные метрики нод кластера.

Метрики пулера соединений в панели управления

Максимальное время ожидания клиента в очередиМаксимальное время ожидания клиента в очереди в выбранной базе данных в секундах
Время ожидания ответа от сервераВремя ожидания ответа от ноды в выбранной базе данных в секундах
Активные подключения к серверуКоличество серверных соединений, связанных с клиентами, в выбранной базе данных
Подключения клиентов к пулу

Количество подключений клиентов к пулу в выбранной базе данных:

  • pools_client_active_connections — количество подключений клиентов, связанных с серверными соединениями или простаивающих без запросов;
  • pools_client_waiting_connections — количество подключений клиентов, где запрос отправлен, но соединения с нодой еще нет

Экспортировать метрики в формате Prometheus

Историческая информация для кластеров недоступна — метрики запрашиваются только в режиме реального времени. Список всех метрик, которые поддерживаются в облачных базах данных, и их описание можно посмотреть в таблице Метрики в формате Prometheus.

  1. Получите токен.
  2. Получите метрики в формате Prometheus.

1. Получить токен

Токен дает доступ к метрикам всех кластеров проекта в одном пуле.

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.

  2. Откройте вкладку Активные.

  3. Откройте страницу кластера → вкладка Мониторинг.

  4. В блоке Токены для Prometheus нажмите Создать токен. Токен будет сгенерирован автоматически.

  5. Скопируйте токен. Для этого в строке токена нажмите .

2. Получить метрики в формате Prometheus

  1. Добавьте в конфигурационный файл Prometheus:

    scrape_configs:
    - job_name: get-metrics-from-dbaas
    scrape_interval: 1m
    static_configs:
    - targets:
    - '<domain>'
    scheme: https
    authorization:
    type: Bearer
    credentials: <token>

    Укажите:

    • <domain> — домен Managed Databases API. Это часть URL для обращения к API без https:// и /v1, например ru-3.dbaas.selcloud.ru. URL зависит от региона и пула, можно посмотреть в списке URL;
    • <token> — токен, который вы скопировали при получении токена на шаге 5.
  2. Откройте в браузере страницу, на которой будут доступны метрики в формате Prometheus:

    http://<ip_address>:9090/targets

    Укажите <ip_address> — IP-адрес, на котором установлен Prometheus.

  3. Самостоятельно настройте мониторинг и алерты для кластеров баз данных.

Метрики в формате Prometheus

Метрики в формате Prometheus предоставляются для всех кластеров. Конкретный кластер можно найти по идентификатору кластера базы данных в лейбле ds_id.

dbaas_memory_percentЗанятая память без учета кэша и буферов операционной системы (RAM) в процентах
dbaas_memory_bytesЗанятая память без учета кэша и буферов операционной системы (RAM) в байтах
dbaas_oom_countКоличество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти
dbaas_cpuИспользование vCPU на нодах кластера базы данных в процентах
dbaas_cpu_iowaitВремя ожидания ввода/вывода в процентах
dbaas_disk_percent

Занятое место на диске в процентах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере PostgreSQL

dbaas_disk_bytes

Занятое место на диске в байтах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере PostgreSQL

dbaas_disk_read_iopsКоличество операций чтения в секунду
dbaas_disk_write_iopsКоличество операций записи в секунду
dbaas_disk_read_bytesСкорость чтения данных с диска в байтах в секунду
dbaas_disk_write_bytesСкорость записи данных на диск в байтах в секунду
dbaas_node_load1Среднее значение загрузки системы за одну минуту. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load5Среднее значение загрузки системы за пять минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load15Среднее значение загрузки системы за 15 минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_network_receive_bytesКоличество байт, принятых через сетевой интерфейс
dbaas_network_transmit_bytesКоличество байт, отправленных через сетевой интерфейс
dbaas_network_receive_packetsКоличество пакетов, принятых через сетевой интерфейс в секунду
dbaas_network_transmit_packetsКоличество пакетов, отправленных через сетевой интерфейс в секунду
dbaas_role

Роль ноды:

  • 0 — роль неизвестна;
  • 1 — мастер;
  • 2 — реплика