Система

  • Предупреждение раньше чем о проблеме узнают пользователи

  • Найти узкие места

  • Данные для планирования масштабирования

  • Спокойствие за работу своего сервиса

Темы

Что мониторить?

Чем мониторить?

Prometeus

Grafana

Zabix

Alert

Типы мониторига

Инфраструктурный мониторинг

  • CPU

  • RAM

  • Disk

  • Сеть

  • Доступность сервисов

    • • HTTP
    • CHECKS
    • PING
  • Состояние кластеров

Мониторинг приложений

  • Время ответа API

  • RPS

  • Ошибки

  • Исключения

  • Трейсинг запросов между микросервисами

Мониторинг бизнес метрик

  • Кол-во заказов

  • Регистрации пользователей

  • Платежи

Синтетический мониторинг

Проверка снаружи

  • Как пользователь видит сайт?

  • Проверки сайта из различных локаций

Логирование

  • Сбор и анализ логов

  • Поиск ошибок и паттернов

  • Дебаг проблем

Современные системы мониторига требуют:

  • автоматически находить новые сервисы

  • собирать метрики, а не только проверять доступность

  • хранить историю для анализа трендов

  • масштабируемость

  • гибкая настройка алёртов

Последнее обновление