Use what you have;
Buy what you need;
Use what you buy;
and if you aren’t using it,
Repurpose or get rid of it.
На ранних этапах развития систем мониторинга в этой сфере применялись иногда совершенно разрозненные компоненты и инструменты. Часто они появлялись как дополнение к комплексной установке нового оборудования (например, при построении или модернизации вычислительного центра компании) либо уже входили в состав программного обеспечения, которое раньше использовалось для других целей. Имели место и отдельные проекты по построению СМ: мониторинг локальной сети – в интересах сетевого отдела, мониторинг серверов – для инфраструктурных подразделений и т.д. Если говорить о поддержке приложений, то в этом случае обычно используются встроенные средства мониторинга. До определенного момента такой подход имел право на жизнь, но в один прекрасный день все столкнулись с проблемой – как собрать всё в одном месте, чтобы каждое подразделение (в особенности руководство ИТ-службы и бизнес-пользователи) понимало, что сейчас не работает и почему. Так появились «зонтичные» системы мониторинга.
Цели построения «зонтичных» СМ – закрыть мониторингом «белые пятна», собрать воедино уже существующие данные по доступности и производительности объектов, добавить полезный функционал для анализа всей информации (с целью корреляции событий, поиска первопричин сбоев, прогнозирования наступления нештатной ситуации) и т.д. ИТ-служба в этом случае получала единую точку контроля состояния инфраструктуры и приложений, бизнес – наглядные схемы и понятные отчеты. Однако основные проблемы все равно фиксировались исключительно на основании обращений пользователей – «не сформировался отчет», «не дошло письмо», «не могу подключиться к корпоративной системе». И начиная с этого момента в бой пошли системы транзакционного мониторинга, также называемые СМ бизнес-процессов.
Смысл решений подобного класса очень прост: давайте на стороне ИТ будет работать пользователь, который «по секрету» станет сообщать, какие проблемы у него возникают. Понятно, что отдельно выделенный сотрудник не сможет оперативно контролировать все выполняемые операции во всех возможных системах. Да и бизнес не согласится ввести в штат такого специалиста. А вот если эти функции будет исполнять программный робот, всё пойдет замечательно. Так получили распространение СМ с помощью синтетических транзакций. Если же по каким-либо причинам подобное воспроизведение невозможно, применяются системы мониторинга реальных действий пользователей – сканеры трафика с аналитическим механизмом его разбора. Можно ли придумать что-либо еще? Наш ответ – да.
Хотелось бы отдельно выделить некоторые преимущества от внедрения решений по управлению ИТ-мощностями:
- анализ зависимости метрик производительности объектов ИТ-инфраструктуры и ключевых показателей эффективности (KPI) обеспечиваемых бизнес-процессов в автоматическом режиме – создание корреляционных матриц;
- создание моделей предельной загрузки ИТ-инфраструктуры в зависимости от потребностей бизнес-процессов – оценка максимально возможных KPI бизнес-процессов с использованием текущей конфигурации ИТ-инфраструктуры;
- проактивное уведомление о возможных нарушениях KPI бизнес-процессов, связанных с нехваткой конкретных ресурсов ИТ-инфраструктуры;
- создание dashboards – интерактивных, настраиваемых панелей отображения информации о текущем и прогнозируемом уровне использования ресурсов ИТ-инфраструктуры в разрезе как ее отдельных элементов, так и бизнес-процессов;
- планирование сценариев консолидации и миграции серверов – определение лучших кандидатов (существующих или новых) для консолидации на физическом оборудовании или переноса в виртуальную инфраструктуру с указанием необходимых дополнительных ресурсов и моделей оптимального распределения и конфигурации по техническим средствам с соблюдением KPI бизнес-процессов;
- сбор и визуализация информации о текущей загрузке виртуальных сред, построение графических карт распределения виртуальных машин на физических хостах (с визуальным кодированием объема предоставленных ресурсов) с указанием трендов по использованию ресурсов, построение отчетов типа ТОП 10 (самые загруженные, самые перераспределенные, наименее часто включаемые виртуальные машины и т.д.).
Эволюция продолжается
В процессе работы систем мониторинга аккумулируется и накапливается огромный массив данных (мы же хотим контролировать загрузку оперативной памяти раз в 5, а то и в 1 минуту?), которые редко используются в долгосрочной перспективе и впоследствии просто стираются. С другой стороны, бизнес зачастую хочет знать, хватит ли ИТ-ресурсов на ближайший квартал или полгода. Не пора ли проводить модернизацию? Достаточно ли ресурсов почтового сервера, если есть планы по открытию нового филиала? Выходом из этой ситуации неопределенности становится система управления ИТ-мощностями – следующий шаг на пути развития СМ.
Кажется, что это инструмент ИТ и для ИТ, но это не совсем так. В качестве пользователей систем подобного рода могут выступать не только специалисты и руководители ИТ-службы, но и сотрудники других подразделений. Руководители высшего звена, благодаря налаженному процессу управления ИТ-мощностями, получают высокоуровневые отчеты, которые показывают, насколько хорошо сейчас используются активы, какие бизнес-системы находятся под угрозой, куда лучше всего инвестировать, чтобы минимизировать риски, связанные с простоем систем, и т.д. Владельцы бизнес-приложений и систем получают сводные отчеты, помогающие оперативно выделять средства и ресурсы для наращивания их потенциала на основе понимания будущих объемов бизнеса. Команда же технической поддержки имеет в своем распоряжении подробную отчетность с анализом преобладающих трендов в ИТ-инфраструктуре, скорости и прогнозов по достижению согласованных пороговых значений. Эти данные можно применить для рассмотрения произошедших сбоев, а также анализа будущих потребностей
Таковы реальные предпосылки для обдумывания потенциальной возможности внедрения решений по управлению ИТ-мощностями. Обычно начинают с малого – отдельного участка ИТ-инфраструктуры (например, серверы или одно-два бизнес-приложения), а затем постепенно расширяют сферу влияния. В дальнейшем нужно помнить о нескольких важных вещах: во-первых, о том, что Capacity Management – это прежде всего регулярный процесс и заниматься им нужно постоянно (подробнее – в статье «Нюансы реализации Capacity Management»,). А во-вторых, о том, что мощности бывают разные, в том числе и сетевые (статья «Capacity Planning для сети»,).