«Мы понимали, что поддерживать одинаково высокий уровень предоставления ИТ-сервисов по всей стране довольно затруднительно без централизованного комплексного контроля функционирования всего ИТ-ландшафта и деятельности ИТ-подразделений на местах, – рассказывает директор Департамента оперативного мониторинга информационных систем (ДОМИС) компании “МТС” Сергей Дубинец. – Для этого на базе филиала макрорегион «Юг» в Краснодаре было создано наше подразделение. Сегодня ДОМИС силами всего лишь 4 одновременно работающих специалистов дежурной смены может контролировать работу всех ИТ-сервисов МТС класса mission- и business-critical (в их числе тарификация, прием платежей, блокировки, интернет-помощник и др.)». Новый подход обусловил появление новых инструментов. Территориальная распределенность и уникальность контролируемой инфраструктуры потребовали создания централизованной системы мониторинга в масштабах страны.
По результатам анализа различных решений в качестве платформы были выбраны технологии HP, одного из лидеров рынка систем управления ИТ. Конкурс на реализацию проекта выиграла компания «Инфосистемы Джет».
Охватить все и сразу
Со стороны ИТ-руководства компании принципиальным условием была возможность постоянного отслеживания доступности ИТ-сервисов, предоставляемых пользователям, абонентам МТС. С технической точки зрения это означало обеспечение сквозного мониторинга – от уровня абонентских услуг до уровня компонентов инфраструктуры. Кроме того, с учетом планируемых нагрузок нужно было максимально автоматизировать деятельность специалистов ДОМИС.
«Обычно такие комплексные проекты длятся около года, но ввиду высокой значимости ЦСМИС для бизнеса на внедрение решения было отведено всего 5 месяцев, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Для нас это был своего рода вызов – приш-лось учесть заданные ограничения при разработке архитектуры и выборе применяемых технологий, а также пересмотреть сам подход к реализации. В итоге уже через 100 рабочих дней система была запущена в эксплуатацию».
Централизованный мониторинг как он есть
ЦСМИС – не просто система мониторинга, подающая сигналы о неисправностях, это полноценная комплексная система управления. «В архитектуру решения мы заложили два базовых принципа, которые позволили существенно увеличить эффективность работы ДОМИС и ИТ-подразделений в регионах, – рассказывает руководитель проекта, начальник отдела управления проектами Департамента систем управления компании “Инфосистемы Джет” Руслан Тукмаков. – Во-первых, система позволяет анализировать все поступающие события и определять список возможных корневых причин их возникновения. Это в разы сокращает общее количество обрабатываемых администраторами событий, ускоряет первичную диагностику и помогает корректно определить команду, в чьей зоне ответственности находится нештатная ситуация. Во-вторых, решение позволяет определить, насколько корневая причина влияет на предоставление конечного сервиса, т.е. помогает приоритизировать действия ИТ-специалистов».
Реализация концепции началась с комплексного обследования ИТ-ландшафта МТС и изучения логики работы информационных систем. Проектная команда совместно с сотрудниками ДОМИС разработала сервисно-ресурсные модели, отражающие зависимости и влияние компонентов прикладного и инфраструктурного уровня на ИТ-сервисы. Были внедрены средства автоматизации процессов мониторинга на базе продукта HP Business Service Management (BSM), разработаны и настроены правила многоступенчатой обработки событий.
В контур контроля вошли серверы, системы виртуализации и хранения, активное сетевое оборудование, системное и прикладное ПО, а также СУБД – в общей сложности более 10 тысяч объектов различного типа в 7 макрорегионах. За счет технологии безагентского мониторинга все подключения к объектам мониторинга для сбора показателей их доступности и производительности происходят удаленно. Это значительно ускорило развертывание ЦСМИС в распределенной ИТ-инфраструктуре телеком-оператора.
Помимо мониторинга компонентов ИТ-ландшафта, реализован контроль качества ИТ-услуг на стороне абонентов. Для этого применяются механизмы синтетического мониторинга (т.е. эмуляции действий реальных пользователей в информационных системах), что позволяет однозначно определить доступность и производительность этих систем.
Обслуживать проще
Параллельно с построением системы мониторинга закладывались и возможности для ее удобной и эффективной эксплуатации. Для сотрудников ДОМИС определены и автоматизированы с помощью комплекса программных средств типовые задачи по диагностике и поддержке работоспособности систем. При этом часть рутинных операций, не требующих участия людей, решение способно выполнять самостоятельно. Автоматизация не только ускорила обработку поступающих событий мониторинга, но и существенно снизила риски ошибок при подключении в контур контроля новых ИС любого масштаба. Последнее особенно важно, так как речь идет о тысячах объектов – ручной труд в таких условиях неприемлем.
Благодаря собственным разработкам компании «Инфосистемы Джет», интегрированным с продуктами HP, созданы уникальные для российского рынка решения. В частности, модуль загрузки объектов мониторинга (МЗОМ) позволяет настраивать в автоматизированном режиме мониторинг тысяч серверов и сетевых узлов. Для своей работы он использует базу конфигураций – так называемый реестр точек мониторинга, содержащий полную информацию по каждому собираемому показателю (около 27 тысяч метрик). Такой подход помогает избежать пропуска серьезных аварий из-за ошибок и неучтенных программных и аппаратных ресурсов. Кроме того, был внедрен модуль проверки доступности объектов, который контролирует корректность мониторинга имеющихся и готовность к нему новых компонентов инфраструктуры, а также оповещает сотрудников ДОМИС о выявленных проблемах.
«Системы автоматизации процессов эксплуатации (так называемые оркестраторы) – для России относительно новое явление. МТС – одна из передовых компаний, в которых данные решения внедрены и реально используются, – поясняет главный конструктор проекта, старший инженер-проектировщик систем управления компании “Инфосистемы Джет” Константин Корниенко. – Нацеленность на результат и готовность к инновациям со стороны руководства ДОМИС позволили нам реализовать в проекте собственные технические идеи, которые не только обогатили функциональность системы мониторинга, но и сократили сроки проекта внедрения».
ЦСМИС – коротко о главном:
- создана за 5 месяцев на базе HP Business Service Management (BSM);
- охватывает более 10 тыс. объектов различного типа (серверов, систем виртуализации и хранения, активного сетевого оборудования, системного и прикладного ПО, СУБД) в 7 макрорегионах;
- контролирует состояние ИС класса mission- и business-critical, а также ряд business support систем;
- поддерживает автоматизированое выполнение регламентных процедур;
- обеспечивает автоматизированную постановку на мониторинг новых объектов после их внесения в реестр точек мониторинга
Подводя итоги
Компания МТС получила удобную технологическую платформу для работы Департамента оперативного мониторинга ИС. Максимальная автоматизация позволила контролировать состояние ИТ-сервисов в масштабе страны силами дежурной смены, состоящей всего из 4 специалистов отдела оперативного мониторинга ИС.
«Совместно с нашими партнерами нам удалось создать уникальную для российской телеком-отрасли систему мониторинга ИС, позволяющую получать полную картину о состоянии ключевых процессов на всех уровнях во всех регионах присутствия, что существенно повышает надежность бизнес-процессов компании и абонентских сервисов. Тонкая настройка и адаптация ЦСМИС под наши нужды позволила снизить нагрузку на ИТ-подразделения и повысить отказоустойчивость систем за счет максимальной автоматизации рутинных операций, значительного сокращения времени на выявление корневых причин событий и появления возможности проактивного мониторинга, – отмечает директор Департамента оперативного мониторинга информационных систем компании “МТС” Сергей Дубинец. – Таким образом, мы получили ценный инструмент для управления событиями в соответствии с лучшими практиками ITIL, цель которого – исключить возможность нештатных ситуаций, влияющих на стабильность работы ИС».
«Высокая результативность данного проекта связана в том числе с максимальной вовлеченностью ИТ-специалистов МТС в процесс внедрения, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Коллеги с готовностью осваивали новые для себя задачи. В результате за короткий срок система стала для них “родной”, что упростило последующую эксплуатацию».
«Мы рады очередному успешному внедрению решения HP Business Service Management (BSM) в крупнейшей российской компании. Уверен, что система, построенная на платформе HP BSM, обеспечит компании МТС эффективное управление корпоративными приложениями, системами и ИТ-инфраструктурой, – комментирует Андрей Кутуков, директор HP Software в России. – В конечном счете, решение поможет оператору существенно повысить качество предоставляемых клиентам услуг».