Перейти к основному содержимому

Справочник метрик

Последнее изменение:

В этой инструкции описаны метрики по продуктам, которые собираются сервисом.

Список продуктов, которые поддерживают метрики, будет пополняться.

Выделенные серверы

Мониторинг поддерживают серверы с KVM-консолью, которая доступна для каждого выделенного сервера, кроме серверов линейки Chipcore и серверов в выделенной стойке — подробнее на странице Серверы в выделенной стойке на selectel.ru.

Набор IPMI метрик может отличаться в зависимости от модели сервера.

В каждой метрике передается timestamp — время сбора метрики. Конвертировать значение можно с помощью онлайн-сервисов, например на сайте unixtimestamp.com.

Имя метрики
Тип, единица измерения
ОписаниеЛейблы
ipmi_bmc_info
Gauge, UNIT
Метаданные BMC (Baseboard Management Controller) — прошивка, производитель и другое. Значение метрики всегда равно 1
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • bmc_url — адрес BMC;
  • firmware_revision — версия прошивки BMC;
  • manufacturer_id — ID производителя (вендора);
  • system_firmware_version — версия системной прошивки (BIOS, UEFI)
up
Gauge, bool

Проверка доступности источника метрик:

  • 1 — успешно;
  • 0 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_up
Gauge, bool

Проверка доступности IPMI:

  • 1 — успешно;
  • 0 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • collector — имя внутреннего коллектора экспортера, который отвечает за сбор определенной группы метрик;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_scrape_duration_seconds
Gauge, секунды
Время сбора метрик IPMI exporter
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_sel_events_count_by_state
Gauge, количество
Количество событий из журнала SEL (System Event Log), сгруппированных по уровню критичности события
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • state — уровень критичности события
ipmi_chassis_cooling_fault_state
Gauge, bool

Состояние системы охлаждения сервера:

  • 1 — исправно;
  • 0 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_chassis_drive_fault_state
Gauge, bool

Состояние дисков:

  • 1 — исправно;
  • 0 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_chassis_power_state
Gauge, bool

Состояние питания сервера:

  • 1 — включен;
  • 0 — выключен
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера
ipmi_fan_speed_state
Gauge, enum

Состояние вентиляторов:

  • 0 — исправно;
  • 1 — отклонение;
  • 2 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — идентификатор датчика;
  • name — имя датчика
ipmi_power_state
Gauge, enum

Состояние питания компонентов сервера:

  • 0 — исправно;
  • 1 — отклонение;
  • 2 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_temperature_state
Gauge, enum

Состояние температуры компонентов сервера:

  • 0 — исправно;
  • 1 — отклонение;
  • 2 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_voltage_state
Gauge, enum

Состояние напряжения:

  • 0 — исправно;
  • 1 — отклонение;
  • 2 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_sensor_state
Gauge, enum

Состояние компонентов сервера:

  • 0 — исправно;
  • 1 — отклонение;
  • 2 — сбой
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика;
  • type — тип датчика
ipmi_fan_speed_rpm
Gauge, RPM
Скорость вращения вентилятора
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_power_watts
Gauge, ватты
Потребляемая мощность
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_temperature_celsius
Gauge, градусы °C
Температура компонентов сервера
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • name — имя датчика;
  • id — ID датчика
ipmi_voltage_volts
Gauge, вольты
Напряжение
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика
ipmi_sensor_value
Gauge
Данные с IPMI датчика. Единица измерения зависит от типа датчика
  • datacenter — название дата-центра, в котором размещен сервер;
  • location_id — пул, в котором размещен сервер;
  • resource_id — UUID сервера;
  • id — ID датчика;
  • name — имя датчика;
  • type — тип датчика

Облачные серверы

Метрики собираются на уровне гипервизора и отражают физическое состояние облачных серверов и их ресурсов — CPU, памяти, дисков и сети. Сбор метрик не зависит от состояния гостевой ОС. Метрики собираются даже если облачный сервер загружается, находится под высокой нагрузкой или не отвечает по сети. Метрики не собираются только когда облачный сервер выключен.

Namespace облачных серверов – compute.

Имя метрики
Тип, единица измерения
ОписаниеЛейблы
server_meta_info
Gauge, UNIT
Метаданные облачного сервера
  • project_name — имя проекта;
  • server_uuid — ID облачного сервера;
  • server_name — имя облачного сервера
server_state_info
Gauge, UNIT

Текущий статус облачного сервера:

  • 0 (no state) — состояние сервера неизвестно или не определено;
  • 1 (running) — сервер работает;
  • 2 (blocked) — сервер заблокирован (ожидает ресурсов или завершения операции чтения или записи с диска);
  • 3 (paused) — сервер приостановлен;
  • 4 (shutdown) — сервер выключается;
  • 5 (shut off) — сервер остановлен и выключен;
  • 6 (crashed) — сервер аварийно завершил работу;
  • 7 (pmsuspended) — сервер приостановлен и перешел в спящий режим
  • server_uuid — ID облачного сервера
cpu_count
Gauge, количество
Количество vCPU облачного сервера
  • server_uuid — ID облачного сервера
vcpu_usage_ratio
Gauge, %
Утилизация каждого из vCPU облачного сервера в %
  • server_uuid — ID облачного сервера;
  • vcpu — номер виртуального процессора
cpu_usage_ratio
Gauge, %
Утилизация CPU облачного сервера в %
  • server_uuid — ID облачного сервера
memory_total_bytes
Gauge, байты
Размер памяти на облачном сервере
  • server_uuid — ID облачного сервера
memory_usage_bytes
Gauge, байты
Используемый размер памяти облачным сервером
  • server_uuid — ID облачного сервера
memory_usage_ratio
Gauge, %
Процент оперативной памяти, которая используется облачным сервером
  • server_uuid — ID облачного сервера
memory_major_faults_total
Counter, штуки
Количество крупных страничных сбоев (major page faults), которые возникли на облачном сервере с момента его последнего запуска
  • server_uuid — ID облачного сервера
disk_meta_info
Gauge, UNIT
Метаданные диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера;
  • disk_type="network" / "file" — тип диска
disk_write_requests_rate
Gauge, операции/с
Количество операций записи в секунду на диск облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_read_requests_rate
Gauge, операции/с
Количество операций чтения в секунду с диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_read_requests_limit
Gauge, операции/с
Максимальное количество операций чтения диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_write_requests_limit
Gauge, операции/с
Максимальное количество операций записи диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_flush_requests_rate
Gauge, операции/с
Количество операций на очистку кэша диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_read_bytes_rate
Gauge, байты/с
Количество байт в секунду, прочитанных с диска облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
disk_write_bytes_rate
Gauge, байты/с
Количество байт в секунду, записанных на диск облачного сервера
  • server_uuid — ID облачного сервера;
  • disk_uuid — ID диска облачного сервера
network_meta_info
Gauge, UNIT
Метаданные сетевых интерфейсов облачного сервера
  • server_uuid — ID облачного сервера;
  • virtual_interface — ID порта облачного сервера
network_receive_packets_rate
Gauge, пакеты/с
Количество пакетов в секунду, полученных на сетевом интерфейсе облачного сервера
  • server_uuid — ID облачного сервера;
  • virtual_interface — ID порта облачного сервера
network_transmit_packets_rate
Gauge, пакеты/с
Количество пакетов в секунду, переданных через сетевой интерфейс облачного сервера
  • server_uuid — ID облачного сервера;
  • virtual_interface — ID порта облачного сервера
network_receive_bits_rate
Gauge, биты/с
Количество бит в секунду, полученных на сетевом интерфейсе облачного сервера
  • server_uuid — ID облачного сервера;
  • virtual_interface — ID порта облачного сервера
network_transmit_bits_rate
Gauge, биты/с
Количество бит в секунду, отправленных через сетевой интерфейс облачного сервера
  • server_uuid — ID облачного сервера;
  • virtual_interface — ID порта облачного сервера