Naumen Business Service Monitoring
Комплексное решение для цифрового мониторинга
и управления ИТ-ландшафтом предприятия


Зонтичный мониторинг: принципы сбора данных

В статье рассмотрим зонтичный мониторинг и как с его помощью организовать сбор и обработку данных для контроля ИТ-инфраструктуры.

Определение зонтичного мониторинга и его цели

Зонтичный мониторинг — это подход, при котором данные от разных систем мониторинга консолидируются и обрабатываются централизованно. Фактически система зонтичного мониторинга становится «панелью управления» для всего ИТ-комплекса. Инструмент позволяет отслеживать взаимосвязи между ИТ-ресурсами и оценивать их влияние на сервисы и услуги.

Зачем нужны такие решения? Часто в крупных организациях для контроля ИТ-ландшафта используются корневой мониторинг. С его помощью отслеживается состояние оборудования определенного типа, например, сетевое или серверное, виртуальные машины, компьютеры и ПО.

Зачастую за работу отдельных участков инфраструктуры отвечают администраторы разных систем. Если возникает сбой, каждый разбирается с проблемой только на «своем» участке. При этом менеджеры услуг, которые отвечают за организацию процессов, не имеют возможности оперативно отслеживать ситуацию и получать информацию о сроках восстановления пострадавших систем и сервисов.

Из-за отсутствия централизованного мониторинга может возникнуть целый ряд проблем:


  • сложно оценить, на какие связанные услуги и сервисы повлиял сбой;
  • невозможно приоритизировать инциденты;
  • трудно обнаружить корневую причину проблемы;
  • сотрудники могут разбираться с одной и той же поломкой одновременно.
принцип работы корневых мониторингов

Системы корневого мониторинга отправляют администраторам уведомления о событиях и инцидентах. Оповещения содержат техническую информацию и могут дублироваться

С помощью зонтичного мониторинга компании могут изменить подход к управлению ИТ, избежать потерь эффективности и нерационального использования ресурсов.

Принципы сбора данных в зонтичном мониторинге

Процессы сбора данных в зонтичном мониторинге реализованы в соответствии с несколькими принципами.

Принцип консолидации. В зонтичный мониторинг поступает информация из нескольких источников — различных инструментов сбора данных. Например, систем инфраструктурного мониторинга и мониторинга приложений. В режиме реального времени выстраивается и актуализируется картина происходящего в ИТ. При этом зонтичный мониторинг помогает контролировать не только ИТ-ресурсы, но и другое важное для предприятия оборудование.

Так, в решении зонтичного мониторинга Naumen Business Service Monitoring предусмотрена возможность подключения по различным протоколам. Самый популярный вариант — протокол http, который позволяет присоединяться к системам, имеющим API. Такой протокол часто используется для передачи информации с датчиков IoT. Также востребован протокол GDBC — с его помощью можно получать информацию из баз данных напрямую. Для работы с популярными системами мониторинга реализованы готовые коннекторы. Чтобы их настроить, нужно ввести только реквизиты подключения.

обработка данных из разных источников в системе зонтичного мониторинга

Naumen BSM обрабатывает информацию из различных источников в соответствии с заранее настроенными правилами

Принцип использования различных методов агрегации метрик. В зонтичном мониторинге применяются различные методы сбора данных или их совокупность.

Задача Метод Суть метода
Мониторинг производительности инфраструктуры Логирование

Сбор метрик


Трассировка

Алертинг
Фиксация всех событий, происходящих в системе

Фиксация показателей состояния оборудования, ПО и сервисов в режиме реального времени

Контроль исполнения запросов

Настройка оповещений о событиях
Мониторинг высокоуровневых данных Стандартизация


Статистический анализ данных


Предиктивная аналитика и машинное обучение
Приведение разноформатной информации к единому виду и обобщение данных из разных систем

Подсчет количественных и качественных показателей оборудования, веб-сервисов, ИТ-систем

Прогнозирование трендов и выявление аномалий в поведении метрик, комплексный анализ метрик

Эти методы могут применяться последовательно на разных этапах сбора данных. Например: сбор метрик из разрозненных источников — стандартизация данных — статистический анализ — представление показателей на дашбордах.

Принцип приземления данных на уровень услуг и сервисов. Одним из ключевых инструментов зонтичных систем является ресурсно-сервисная модель. Модель простраивает взаимосвязи между различными ИТ-ресурсами, оборудованием, сервисами и услугами.

Информация из различных источников обогащает РСМ. В результате модель отображает актуальные связи между оборудованием, ПО и услугами. Также РСМ позволяет оценивать влияние различных событий на сервисы, быстрее определять локализацию корневой причины сбоя и принимать меры, чтобы не допустить отключение услуг.

принцип работы корневых мониторингов

Ресурсно-сервисная модель может обогащаться данными из различных инфраструктурных решений

Принцип доступности и наглядности. Собранные данные стандартизируются и обрабатываются в соответствии с правилами обработки событий, при этом учитывается план профилактических работ (события, произошедшие во время профилактики, например, отключение сервера, могут не регистрироваться как инциденты). Также система зонтичного мониторинга умеет отправлять уведомления всем заинтересованным участникам процесса. Например, при инциденте менеджер услуг получит автоматическое оповещение с понятным содержанием: что сломалось, на какую услугу повлияло, когда плановое время восстановления работоспособности.

принцип работы зонтичного мониторинга

Система автоматически отправляет уведомления о событии или инциденте всем нужным специалистам

Помимо этого, в зонтичном мониторинге используются инструменты, которые позволяют визуализировать информацию. Например, те же ресурсно-сервисные модели, специальные дашборды и графики.

Аналитика собранных данных и принятие решений на основе результатов анализа

Зонтичный мониторинг предусматривает различные инструменты анализа. Например, механизмы статистического анализа «подсчитывают» количественные и качественные значения метрик. А предиктивные модели выявляют закономерности в работе устройств, формируют прогнозы, оценивают влияние бизнес-метрик на производительность.

Результаты подобной аналитики отображаются на дашбордах. Интересующие метрики и показатели можно выводить в наглядном виде с помощью различных виджетов. Например, спидометр, график, диаграмма.

Дашборды позволяют контролировать:


  • здоровье услуг;
  • состояние ИТ-инфраструктуры в целом;
  • состояние конкретного оборудования;
  • работу ИТ-команды.

Дашборды можно настраивать таким образом, чтобы получать сквозную аналитику по услугам и сервисам. Например, видеть количество событий и инцидентов по услуге и связанному с ней оборудованию.

построение отчетов в системе зонтичного мониторинга

Аналитический дашборд по услуге «Электронная почта» в Naumen BSM, на который выводятся количественные и динамические данные

Комплексные данные дают возможность принимать решения, связанные с управлением мощностями и ресурсами, изменением бизнес-процессов, повышением эффективности работы технических специалистов.

В результате зонтичный мониторинг позволяет получить целостный взгляд на сервисы и услуги через призму ИТ-инфраструктуры, оценить оперативную ситуацию в ИТ, а также отследить динамику изменения метрик.



Что еще интересного

Предиктивная аналитика в мониторинге ИТ
#фичи

Рассматриваем, как предиктивные модели помогают сократить число инцидентов и сбоев.

Как построить эффективную инфраструктуру
#лучшие_практики

Разбираем пять принципов, с помощью которых строится комплексное управление инфраструктурой.

Уровни управления инфраструктурой
#лучшие_практики

Описываем уровни работы с инфраструктурными данными и задачи, которые решаются на каждом из них.