© 1995-2022 Компания «Инфосистемы Джет»
Причины изменения подхода к мониторингу IT инфраструктуры
Программное обеспечение Программное обеспечение

Почему подход к мониторингу ИТ-инфраструктуры начал меняться? Какую роль в этом играют Open Source, базы данных и машинное обучение? Почему современные системы мониторинга — это решения Business Critical?

Главная>Программное обеспечение>«Компания потеряла 50 млн рублей, потому что 4 часа не могла найти причину проблемы»
Программное обеспечение Тренд

«Компания потеряла 50 млн рублей, потому что 4 часа не могла найти причину проблемы»

05.10.2021

Посетителей: 472

Просмотров: 477

Время просмотра: 2.6 мин.

Авторы

Автор
Алексей Акопян руководитель направления мониторинга компании «Инфосистемы Джет»

Почему подход к мониторингу ИТ-инфраструктуры начал меняться?

 

Какую роль в этом играют Open Source, базы данных и машинное обучение?

 

Почему современные системы мониторинга — это решения Business Critical?

 

Как клиенты стали важнее серверов

 

В области мониторинга ИТ-инфраструктуры идут серьезные перемены. Владельцы бизнеса больше не задаются вопросом «Хорошо ли работает моя ИТ-инфраструктура?», их интересуют качество услуги, которую получает клиент, ее скорость и доступность. Компаниям важно понимать, насколько быстро работает тот или иной бизнес-процесс. В основе этих перемен лежат массовая цифровизация и возрастающая конкуренция. За внимание потребителя бьются не только компании, но и целые экосистемы. Рынок систем мониторинга тоже реагирует на эти тенденции — сейчас на нем превалирует сервисный подход. 

 

Попытки реализовать этот подход начались еще 15 лет назад, но тогда рынок технически не был к этому готов. Инструменты мониторинга не обеспечивали необходимую функциональность, а крупные игроки не спешили исправлять ситуацию. Это снижало гибкость рынка, и в какой-то момент он начал откровенно стагнировать. Сейчас ситуация изменилась. Ниже я подробно рассмотрю причины этих изменений — развитие Open Source, нереляционных баз данных и машинного обучения (в частности, решений класса AIOps). 

 

Но сначала…

 

Мониторинг как система business critical

 

Вопрос «Какова важность систем мониторинга в современной ИТ-инфраструктуре?» имеет простой ответ: без них бизнес остановится. Большинство компаний обслуживают клиентов и генерируют прибыль с помощью цифровых сервисов, у которых есть высокие требования к доступности. Я вживую наблюдал, как у заказчика упал онлайн-магазин: за 4 часа простоя компания потеряла 50 млн рублей, потому что не могла локализовать и решить проблему. При наличии соответствующих инструментов простой длился бы 15 минут.

 

 

Причина изменений в мониторинге № 1: Open Source

 

ПО с открытым кодом уже догнало коммерческие продукты по функциональности, местами даже начинает вытеснять их с рынка. Определенно можно сказать, что инфраструктурный мониторинг практически на 100% сегодня можно закрыть подобными решениями. Например, Zabbix сейчас представляет собой полноценную универсальную систему мониторинга для инфраструктур любого размера. Prometheus де-факто является стандартом для оперативного мониторинга контейнерных сред. Elasticsearch повсеместно используется для сбора большого количества структурированных или неструктурированных данных для ретроспективной и real-time-аналитики. 90% наших заказчиков изучают ПО Open Source и планируют его использовать в своей ИТ-инфраструктуре. Вокруг продуктов с открытым кодом собралось большое комьюнити: на тематических форумах можно найти ответ практически на любой вопрос, то есть проблема поддержки, о которой часто говорят противники Open Source, на самом деле решается легко. В то же время вендоры охотно переупаковывают открытое ПО и предлагают свою поддержку. Например, Zabbix продает сервис напрямую или через партнеров.

 

Причина № 2: базы данных NoSQL

 

У реляционных БД есть недостатки: они масштабируются до определенных пределов, медленно обрабатывают запросы к историческим данным и плохо работают с неструктурированной информацией. А современные системы не всегда раскладывают данные по размеченным полям таблицы — чаще всего сейчас на вход идет именно неструктурированный поток.

 

Здесь на помощь бизнесу пришли БД NoSQL. Они позволяют хранить неструктурированные данные в любом объеме, и у них нет проблем с поиском. Ярким примером является все та же Elasticsearch — база данных и поисковая система, которая может практически безгранично масштабироваться. Решением пользуются Quora, SoundCloud, GitHub и Netflix. Другой пример — ClickHouse, колоночная аналитическая СУБД с открытым кодом, которую разрабатывает «Яндекс». 

 

Теперь системы мониторинга получили возможность накапливать данные для аналитики за длительный период времени из большего количества источников и быстро получать к ним доступ. Это, в свою очередь, обеспечивает более вариативную выборку для своевременного определения истинной причины проблемы.

 

 

Причина № 3: машинное обучение

 

Как и в случае с NoSQL, движущей силой перемен стали возросшие объемы данных, которые системы мониторинга должны собирать из разных источников. Вручную искать проблемы в потоке информации становится все сложнее, рукописные правила корреляции больше не работают: слишком много нюансов, учесть все практически невозможно. Из-за этого бизнес может получать недостоверную информацию.

 

Решение проблемы — машинное обучение. Специализированные инструменты, основанные на методах ML, способны объединять информацию из разных источников, сопоставлять несопоставимые данные, события и метрики и выявлять закономерности. 

 

Пока технологии ML применяются далеко не во всех системах мониторинга, где-то работают в усеченном варианте, но тренд очевиден. Со временем машинное обучение заменит написание правил вручную. 

 

Здесь уместно упомянуть решения класса AIOps. Как правило, компании используют несколько систем мониторинга, поэтому получают фрагментированные данные о состоянии ИТ-инфраструктуры. AIOps-платформы, в частности Watson AIOps от IBM, интегрируются со всеми инструментами мониторинга, к ним также можно подключить системы управления процессами. Они сводят полученную информацию воедино и предоставляют пользователю комплексную аналитику.

 

С помощью методов машинного обучения AIOps позволяет выявлять инциденты в режиме реального времени с помощью интеллектуальной корреляции событий. Платформа AIOps сопоставляет события, поступающие от разных источников: сетей, инфраструктуры, инженерных систем, приложений, баз данных и т.д. События, поступающие в платформу, проходят несколько этапов: сбор и анализ данных, «шумоподавление» ненужных инцидентов, извлечение полезной информации, расчет, анализ данных и выявление ключевых проблем. Решения этого класса способны поддерживать гетерогенные, мультивендорные среды и готовы к работе с любыми существующими и будущими технологическими стеками.

 

Поскольку теперь мониторинг — это системы business critical, относиться к ним нужно должным образом. Это уже не просто инструмент, который упрощает работу системных администраторов. Это инструмент бизнеса, который помогает не потерять деньги или как минимум сократить убытки. Следующий шаг — развивать системы мониторинга, чтобы с их помощью оптимизировать ресурсы компании и грамотнее управлять имеющимися мощностями. Главное — поменять свое восприятие и сделать это прямо сейчас.

 

Сегодня мы наблюдаем, как меняется отношение к мониторингу у наших клиентов. Пять лет назад все платили «мзду» за поддержку одному из больших вендоров, например HP или BMC. Интерес к мониторингу был на уровне «эта штука просто должна быть, так мне айтишники сказали». Мы делаем десятки комплексных инфраструктурных проектов в год. И почти каждый заказчик по той или иной причине недоволен своим мониторингом и хочет его изменить. Мы развернули собственную лабораторию мониторинга с классическими решениями (Zabbix, Grafana, Prometheus, ELK), продуктами APM, AIOps, зонтичным, облачным мониторингом и т.д. В ней можно проверить эти технологии в деле. 

Уведомления об обновлении тем – в вашей почте

Рабочая станция как бизнес-приложение

Мониторинг работы бизнес-приложений, направленный на определение и контроль значений параметров "удовлетворенности" пользователей при работе с основными производственными системами, безусловно, важен. Многие наши заказчики ориентируются именно на такой подход, но иногда забывают, что в итоге рабочим инструментом пользователя является рабочая станция: как стационарный компьютер, так и ноутбук, и даже тонкий клиент.

Виртуальные ленточные библиотеки. Мифы и реальность

Современные системы хранения данных (СХД) обеспечивают исключительно высокий уровень надежности хранения благодаря отказоустойчивой архитектуре оборудования, включающей в себя дублирование компонентов, поддержку механизмов RAID и т.д., а также за счет применения средств создания копий данных, моментальных снимков (snapshot) и репликации.

Обеспечение информационной безопасности в вычислительных комплексах на базе мэйнфреймов

Лет 30-40 назад информационные системы строились только на базе мэйнфреймов. Соответственно, архитектура информационной системы, как правило, была централизованной. Затем наступила эра малых машин, распределенных архитектур обработки ...

Современные виртуализированные системы хранения данных

Тема виртуализации ресурсов современного вычислительного комплекса в последнее время является чрезвычайно популярной и освещается широко и разносторонне в различных изданиях по ИТ-тематике. Но большая часть рассматриваемых технологий и методов использования виртуализации, как правило, относится к серверным ресурсам: это аппаратная виртуализация серверов или организация множества виртуальных ОС на одном физическом сервере.

Интервью с Иваном Шиловым, ведущим специалистом по развитию бизнеса IBM Maximo компании IBM EE/A

При всех безусловных достоинствах EAM-систем реализованные в этой сфере проекты в России пока исчисляются единицами. Чем обусловлена сложившаяся ситуация, и когда можно ожидать ее кардинального изменения? Как можно охарактеризовать российский рынок EAM-решений? Свое мнение высказывает Иван Шилов, ведущий специалист по развитию бизнеса IBM Maximo компании IBM EE/A.

Самый безопасный SOC

По оценкам отечественных специалистов в области ИБ, в настоящее время уровень информационной безопасности в российских компаниях по сравнению с западными не очень высок, но темпы развития в разы выше

Интервью с Владимиром Сушиным, директором Университетского центра Интернет ПГНИУ

ИТ сегодня стали неотъемлемой частью и условием развития не только бизнеса, но и отраслей, которые еще несколько лет назад считались не зависящими от них.

Унифицированная ИТ-инфраструктура для SAP ERP в концерне «Силовые машины»

Проектируя ИТ-инфраструктуру для внедрения SAP ERP, специалисты компании «Инфосистемы Джет» должны были решить сразу две глобальные задачи

«Облачные вычисления». Взгляд из IBM

В последние годы многие эксперты пророчат революцию в мире ИТ благодаря новому подходу в организации инфраструктуры - облачным вычислениям. Согласно опросу IBM Global CIO Study 2009 более трети руководитель ИТ-отделов назвали это направление развития одним из самых важных в информационных технологиях.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня