и управления ИТ-ландшафтом предприятия
Зонтичный мониторинг: принципы сбора данных
В статье рассмотрим зонтичный мониторинг и как с его помощью организовать сбор и обработку данных для контроля
Определение зонтичного мониторинга и его цели
Зонтичный мониторинг — это подход, при котором данные от разных систем мониторинга консолидируются и обрабатываются централизованно. Фактически система зонтичного мониторинга становится «панелью управления» для всего
Зачем нужны такие решения? Часто в крупных организациях для контроля
Зачастую за работу отдельных участков инфраструктуры отвечают администраторы разных систем. Если возникает сбой, каждый разбирается с проблемой только на «своем» участке. При этом менеджеры услуг, которые отвечают за организацию процессов, не имеют возможности оперативно отслеживать ситуацию и получать информацию о сроках восстановления пострадавших систем и сервисов.
Из-за отсутствия централизованного мониторинга может возникнуть целый ряд проблем:
- сложно оценить, на какие связанные услуги и сервисы повлиял сбой;
- невозможно приоритизировать инциденты;
- трудно обнаружить корневую причину проблемы;
- сотрудники могут разбираться с одной и той же поломкой одновременно.
Системы корневого мониторинга отправляют администраторам уведомления о событиях и инцидентах. Оповещения содержат техническую информацию и могут дублироваться
С помощью зонтичного мониторинга компании могут изменить подход к управлению ИТ, избежать потерь эффективности и нерационального использования ресурсов.
Принципы сбора данных в зонтичном мониторинге
Процессы сбора данных в зонтичном мониторинге реализованы в соответствии с несколькими принципами.
Принцип консолидации. В зонтичный мониторинг поступает информация из нескольких источников — различных инструментов сбора данных. Например, систем инфраструктурного мониторинга и мониторинга приложений. В режиме реального времени выстраивается и актуализируется картина происходящего в ИТ. При этом зонтичный мониторинг помогает контролировать не только
Так, в решении зонтичного мониторинга Naumen Business Service Monitoring предусмотрена возможность подключения по различным протоколам. Самый популярный вариант — протокол http, который позволяет присоединяться к системам, имеющим API. Такой протокол часто используется для передачи информации с датчиков IoT. Также востребован протокол GDBC — с его помощью можно получать информацию из баз данных напрямую. Для работы с популярными системами мониторинга реализованы готовые коннекторы. Чтобы их настроить, нужно ввести только реквизиты подключения.
Naumen BSM обрабатывает информацию из различных источников в соответствии с заранее настроенными правилами
Принцип использования различных методов агрегации метрик. В зонтичном мониторинге применяются различные методы сбора данных или их совокупность.
Задача | Метод | Суть метода |
---|---|---|
Мониторинг производительности инфраструктуры |
Логирование
Сбор метрик Трассировка Алертинг |
Фиксация всех событий, происходящих в системе
Фиксация показателей состояния оборудования, ПО и сервисов в режиме реального времени Контроль исполнения запросов Настройка оповещений о событиях |
Мониторинг высокоуровневых данных |
Стандартизация
Статистический анализ данных Предиктивная аналитика и машинное обучение |
Приведение разноформатной информации к единому виду и обобщение данных из разных систем
Подсчет количественных и качественных показателей оборудования, Прогнозирование трендов и выявление аномалий в поведении метрик, комплексный анализ метрик |
Эти методы могут применяться последовательно на разных этапах сбора данных. Например: сбор метрик из разрозненных источников — стандартизация данных — статистический анализ — представление показателей на дашбордах.
Принцип приземления данных на уровень услуг и сервисов. Одним из ключевых инструментов зонтичных систем является
Информация из различных источников обогащает РСМ. В результате модель отображает актуальные связи между оборудованием, ПО и услугами. Также РСМ позволяет оценивать влияние различных событий на сервисы, быстрее определять локализацию корневой причины сбоя и принимать меры, чтобы не допустить отключение услуг.
Ресурсно-сервисная модель может обогащаться данными из различных инфраструктурных решений
Принцип доступности и наглядности. Собранные данные стандартизируются и обрабатываются в соответствии с правилами обработки событий, при этом учитывается план профилактических работ (события, произошедшие во время профилактики, например, отключение сервера, могут не регистрироваться как инциденты). Также система зонтичного мониторинга умеет отправлять уведомления всем заинтересованным участникам процесса. Например, при инциденте менеджер услуг получит автоматическое оповещение с понятным содержанием: что сломалось, на какую услугу повлияло, когда плановое время восстановления работоспособности.
Система автоматически отправляет уведомления о событии или инциденте всем нужным специалистам
Помимо этого, в зонтичном мониторинге используются инструменты, которые позволяют визуализировать информацию. Например, те же
Аналитика собранных данных и принятие решений на основе результатов анализа
Зонтичный мониторинг предусматривает различные инструменты анализа. Например, механизмы статистического анализа «подсчитывают» количественные и качественные значения метрик. А предиктивные модели выявляют закономерности в работе устройств, формируют прогнозы, оценивают влияние
Результаты подобной аналитики отображаются на дашбордах. Интересующие метрики и показатели можно выводить в наглядном виде с помощью различных виджетов. Например, спидометр, график, диаграмма.
Дашборды позволяют контролировать:
- здоровье услуг;
- состояние
ИТ-инфраструктуры в целом; - состояние конкретного оборудования;
- работу
ИТ-команды .
Дашборды можно настраивать таким образом, чтобы получать сквозную аналитику по услугам и сервисам. Например, видеть количество событий и инцидентов по услуге и связанному с ней оборудованию.
Аналитический дашборд по услуге «Электронная почта» в Naumen BSM, на который выводятся количественные и динамические данные
Комплексные данные дают возможность принимать решения, связанные с управлением мощностями и ресурсами, изменением
В результате зонтичный мониторинг позволяет получить целостный взгляд на сервисы и услуги через призму
Что еще интересного
Рассматриваем, как предиктивные модели помогают сократить число инцидентов и сбоев.
Разбираем пять принципов, с помощью которых строится комплексное управление инфраструктурой.
Описываем уровни работы с инфраструктурными данными и задачи, которые решаются на каждом из них.