Naumen Business Service Monitoring
Комплексное решение для цифрового мониторинга
и управления ИТ-ландшафтом предприятия


Зонтичный мониторинг ИТ-ресурсов: что это такое и какие задачи решает

Бизнес не может существовать без ИТ, а ИТ — без систем мониторинга, которые контролируют работоспособность систем и оборудования. Но если раньше состояние ИТ-инфраструктуры отслеживали множество разрозненных систем мониторинга, то сейчас для этих целей можно использовать централизованный инструмент — систему зонтичного мониторинга.

Что такое ИТ-мониторинг

Использование систем мониторинга — обычная практика для бизнеса. Если в компании есть ПО, серверы, компьютеры, оборудование и прочие ИТ-ресурсы, то, скорее всего, есть и решения, которые контролируют их работу. Этим занимаются специальные системы мониторинга ИТ-ресурсов. Благодаря такому мониторингу проблемы в ИТ можно быстро выявить и устранить.

В мониторинге участвуют и технические средства — системы мониторинга, учета и управления ИТ, и люди — ИТ-специалисты, администраторы систем, менеджеры услуг, операторы технической поддержки, конечные пользователи.

На верхнем уровне ИТ-мониторинг делится на следующие типы:


  • Инфраструктурный или классический мониторинг. Решения подключаются непосредственно к объектам мониторинга и собирают «сырые» данные. Они наблюдают, регистрируют проблемы в режиме онлайн и отправляют оповещения о сбоях ИТ-специалистам. Также записывают «черные ящики», то есть хранят исторические данные и метрики. По сути инфраструктурный мониторинг автоматизирует контроль работоспособности разных элементов ИТ-инфраструктуры — сетевого оборудования, серверов, виртуальных машин, рабочих станций. Специалистам не нужно вручную диагностировать каждую программу, сервер или компьютер.
  • Зонтичный мониторинг. Его называют следующим шагом эволюции систем мониторинга. Системы зонтичного мониторинга оценивают состояние ИТ-инфраструктуры, а также работоспособность услуг и сервисов.

Инфраструктурный и зонтичный мониторинги решают разные задачи. Инфраструктурный — сигнализирует о проблеме, которая уже произошла, зонтичный — позволяет рассматривать ИТ-ландшафт с точки зрения бизнес-задач. Собственно говоря, зонтичный мониторинг появился тогда, когда бизнесу стало не хватать простого контроля за ИТ-ресурсами, а появилась потребность управлять ИТ-ландшафтом, чтобы обеспечить доступность услуг и сервисов.

Зачем бизнесу зонтичный мониторинг

Инфраструктурные системы дают представление о состоянии того объекта, работу которого они мониторят. Проблема в том, что в предоставлении одной услуги обычно задействовано множество ИТ-ресурсов. А инфраструктурный мониторинг не дает общей картины, как связаны программное обеспечение, оборудование, рабочие станции и прочие объекты. Из-за этого сложно определить, почему сервис перестал работать, где именно возникла проблема и как повлияет сбой на работу других услуг.

Допустим, менеджер отдела продаж фиксирует сделки в CRM. Программа начала зависать, а потом и вовсе отключилась. Пользователь отправляет заявку инженеру поддержки в ИТ. Чтобы выяснить, в чем проблема, инженер собирает данные из нескольких систем инфраструктурного мониторинга — которые контролируют работу самой CRM, серверов, сетевого оборудования. Если на корпоративном сайте компании настроены формы обратной связи, информация с которых также автоматически попадает в CRM, то нужно дополнительно проверить интеграцию с сайтом. В результате только поиск участка, где случился сбой, может занять много времени. А еще нужно обнаружить первопричину сбоя и устранить его. При этом способ решения проблемы ИТ-специалист должен найти самостоятельно в авральном режиме.

Зонтичный мониторинг упрощает и автоматизирует весь этот процесс. Система агрегирует информацию о работе инфраструктуры из разных источников, анализирует ее и дает целостное представление о состоянии ИТ-ресурсов и услуг. И все это в единой системе и в режиме онлайн. Благодаря централизованному мониторингу ИТ-сервисы лучше работают и реже прерываются. Также сокращается длительность простоев из-за инцидентов, если сбои все-таки возникают.

Какие задачи решает зонтичный мониторинг

Зонтичный мониторинг помогает обеспечить практически бесперебойную работу ИТ-инфраструктуры путем решения нескольких ключевых задач. Система дает возможность наблюдать, анализировать, оценивать, прогнозировать состояние ИТ в комплексе, что в итоге позволяет управлять инфраструктурой.

Консолидация данных о состоянии ИТ-ресурсов из разрозненных систем. Решение не подключается к объектам мониторинга напрямую, а собирает «сырые» данные от систем инфраструктурного мониторинга, учетных и управляющих систем. Данные мониторинга агрегируются и хранятся в единой системе, что позволяет получить целостный взгляд на услуги, сервисы и ИТ-ресурсы.

Установление взаимосвязей между объектами инфраструктуры и ИТ-услугами. Данные о работе ИТ-систем сами по себе мало о чем говорят. Технические специалисты используют их при расследовании инцидентов или для проверки работоспособности оборудования. Но чтобы понять, как одно событие повлияло на другое, инженеру придется изучить множество разрозненных источников. Кроме того, это технические данные, которые непонятны не-специалистам.

Поэтому зонтичный мониторинг не только консолидирует и анализирует данные из разных систем, но и привязывает их к ресурсно-сервисной модели ИТ-систем и услуг. Ресурсно-сервисная модель — основа зонтичного мониторинга. На модели показываются ИТ-активы, услуги и сервисы компании и связи между ними. Например, на РСМ будет видно, что для корректной работы услуги «Корпоративная почта» должны функционировать почтовый сервер, СУБД, каналы связи, инфраструктурные фермы, вплоть до технологического уровня: систем питания, кондиционирования ЦОД и т.д.

Если инцидент произошел, или появился риск его возникновения, РСМ поможет быстро понять, как сбой отразится на доступности сервисов и услуг. На схеме будет видно, где произошел инцидент и как он связан с конкретным учетным объектом и с информационной системой, в рамках которой этот объект используется. Также РСМ дает возможность находить коренную причину инцидента. Например, диагностика показала, что сервер перегружен. ИТ-специалист будет уведомлен, какие услуги пострадают, если проблему не удастся вовремя решить и сервер все-таки отключится.

Прогнозирование инцидентов. Реагировать на «пожар», когда он уже случился, сегодня уже недостаточно. Системы зонтичного мониторинга используют инструменты предиктивной аналитики на базе машинного обучения. Это позволяет действовать проактивно, не дожидаясь, когда пользователи позвонят в службу поддержки и сообщат о недоступности услуги. Нейросети сопоставляют текущие данные мониторинга с историческими данными об инцидентах, выявляют закономерности и отклонения. На базе этой аналитики строится прогноз работоспособности систем, что позволяет выявлять и устранять сбои до того, как они нанесли ущерб бизнесу.

Организация процесса управления событиями. Система позволяет создать единые правила реагирования на отклонения и объединить данные мониторинга с процессами поддержки. Например, компания интегрировала систему зонтичного мониторинга и Service Desk — систему для управления поддержкой пользователей. Зонтичная система обнаружила поломку оборудования и остановку услуги. Система создала в Service Desk запрос на восстановление и адресовала его нужному специалисту. Специалист устранил поломку.

Получение оперативной аналитики о состоянии ИТ-услуг. Зонтичная система позволяет настроить дашборды и контролировать метрики, например, зафиксированные инциденты по услугам, общее количество инцидентов за период времени, среднее время реакции на инциденты. Также система позволяет собирать статистическую отчетность, которая может пригодиться во время переговоров с внешними поставщиками услуг, например, с интернет-провайдером.

Другие возможности зонтичного мониторинга:


  • исключение возникновения противоречащих событий и ложных срабатываний за счет приведения метрик и триггеров из разных источников в единый формат и их настройки по заданным параметрам;
  • оценка влияния сбоев на бизнес-процессы и приоритизация действий, чтобы в первую очередь решались наиболее критичные проблемы;
  • уведомление заинтересованных лиц о статусе решения. В случае возникновения инцидента все администраторы могут проследить ход расследования инцидента, установленные сроки и влияние на сервисы;
  • создание базы знаний по решению инцидентов.

Как понять, нужен ли зонтичный мониторинг

Практически любому бизнесу зонтичный мониторинг необходим. Однако, как и в любом правиле, есть исключения. Обычно они связаны с тем, что отсутствует необходимость агрегировать данные. Например, небольшая организация или отдельное подразделение крупной компании обходится системами инфраструктурного мониторинга для контроля нескольких компонентов ИТ-ландшафта — составляющими отдельного сервиса.

А бывают случаи, когда для комплексного мониторинга не нужны системы инфраструктурного мониторинга. Например, компания использует исключительно облачные сервисы. Данные собирает система управления, откуда они поступают в систему зонтичного мониторинга.

Обычно именно крупным компаниям без мониторинга не обойтись, хотя масштаб тут не играет определяющей роли. Дело именно в многокомпонентности ИТ-ландшафта. Если в компании сложная инфраструктура, зонтичный мониторинг — это единственный способ получить комплексный взгляд на состояние ИТ-ресурсов, сервисов и услуг. Целостный подход несет множество выгод. Прежде всего, сокращается время на выявление проблем. Не нужно перемещаться между различными системами мониторинга и анализировать разрозненные данные. Зонтичный мониторинг предоставляет всю необходимую информацию. Кроме того, появляется возможность сократить число инцидентов, вовремя реагировать на отклонения метрик и решать проблемы по оптимальным алгоритмам.



Что еще интересного

5 признаков, что компании нужен зонтичный мониторинг
#лучшие_практики

Какие признаки говорят о том, что системы инфраструктурного мониторинга уже недостаточно для полноценной работы ИТ-службы.

Визуализация данных как метод диагностики ИТ-сервисов
#как_работает

Какие дашборды можно реализовать в системе зонтичного мониторинга и как они помогают отслеживать здоровье предоставляемых сервисов.

Предиктивная аналитика в ИТ-мониторинге
#технологии

Рассматриваем риски классического мониторинга и как предиктивные технологии усиливают возможности управления инфраструктурой.