Мониторинг вашего мониторинга
Alertmanager не пришлёт алерт о собственной смерти. Puls следит за вашей системой мониторинга снаружи — через независимый канал — и бьёт тревогу, когда heartbeat перестаёт поступать.
Слепое пятно любого стека мониторинга — закрыто.
Prometheus отправляет Watchdog алерт каждые N секунд. Puls ждёт его. Если за настроенный интервал ничего не пришло — поднимает тревогу.
Уведомления идут через Telegram, SMS, голосовой звонок или email — каналы независимые от вашего стека. Если Alertmanager мёртв, они всё равно работают.
Один Puls следит за несколькими Alertmanager'ами одновременно. Разные интервалы, разные каналы уведомлений, разные получатели для каждого.
Настраиваемое окно терпимости. Рестарт Alertmanager во время планового обслуживания не вызовет ложную тревогу. Silence через API на время работ.
Веб-интерфейс со статусом всех источников, историей heartbeat'ов и временем последнего сигнала. Метрики экспортируются в формате Prometheus.
Один Docker-контейнер, один YAML-конфиг. Разворачивается рядом со стеком мониторинга или на отдельном хосте — что важнее для надёжности.
Настройка за 10 минут.
vector(1) — всегда true. Prometheus генерирует алерт Watchdog каждые 60 секунд — это и есть heartbeat.Watchdog на endpoint Puls. Puls получает сигнал и обнуляет таймер.Self-hosted, один docker-compose, настройка за 10 минут.