Централизованная система мониторинга инфо-систем для МТС
Программное обеспечение Программное обеспечение

Для компании МТС, одного из ведущих российских телеком-операторов, важно, что называется, держать марку во всех регионах присутствия

Главная>Программное обеспечение>Централизованная система мониторинга информационных систем (ЦСМИС) для компании МТС
Программное обеспечение Тема номера

Централизованная система мониторинга информационных систем (ЦСМИС) для компании МТС

Дата публикации:
16.02.2015
Посетителей:
516
Просмотров:
453
Время просмотра:
2.3
Для компании МТС, одного из ведущих российских телеком-операторов, важно, что называется, держать марку во всех регионах присутствия. Это касается в том числе и качества оказания абонентских ИТ-услуг. Данный фактор впрямую влияет на отношение к бренду в целом и в условиях высокой конкуренции может стать определяющим для потребителя.

 

 

«Мы понимали, что поддерживать одинаково высокий уровень предоставления ИТ-сервисов по всей стране довольно затруднительно без централизованного комплексного контроля функционирования всего ИТ-ландшафта и деятельности ИТ-подразделений на местах, – рассказывает директор Департамента оперативного мониторинга информационных систем (ДОМИС) компании “МТС” Сергей Дубинец. – Для этого на базе филиала макрорегион «Юг» в Краснодаре было создано наше подразделение. Сегодня ДОМИС силами всего лишь 4 одновременно работающих специалистов дежурной смены может контролировать работу всех ИТ-сервисов МТС класса mission- и business-critical (в их числе тарификация, прием платежей, блокировки, интернет-помощник и др.)». Новый подход обусловил появление новых инструментов. Территориальная распределенность и уникальность контролируемой инфраструктуры потребовали создания централизованной системы мониторинга в масштабах страны.

 

По результатам анализа различных решений в качестве платформы были выбраны технологии HP, одного из лидеров рынка систем управления ИТ. Конкурс на реализацию проекта выиграла компания «Инфосистемы Джет».

 

Охватить все и сразу

 Со стороны ИТ-руководства компании принципиальным условием была возможность постоянного отслеживания доступности ИТ-сервисов, предоставляемых пользователям, абонентам МТС. С технической точки зрения это означало обеспечение сквозного мониторинга – от уровня абонентских услуг до уровня компонентов инфраструктуры. Кроме того, с учетом планируемых нагрузок нужно было максимально автоматизировать деятельность специалистов ДОМИС.

 

«Обычно такие комплексные проекты длятся около года, но ввиду высокой значимости ЦСМИС для бизнеса на внедрение решения было отведено всего 5 месяцев, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Для нас это был своего рода вызов – приш-лось учесть заданные ограничения при разработке архитектуры и выборе применяемых технологий, а также пересмотреть сам подход к реализации. В итоге уже через 100 рабочих дней система была запущена в эксплуатацию».

 

Централизованный мониторинг как он есть

 

ЦСМИС – не просто система мониторинга, подающая сигналы о неисправностях, это полноценная комплексная система управления. «В архитектуру решения мы заложили два базовых принципа, которые позволили существенно увеличить эффективность работы ДОМИС и ИТ-подразделений в регионах, – рассказывает руководитель проекта, начальник отдела управления проектами Департамента систем управления компании “Инфосистемы Джет” Руслан Тукмаков. – Во-первых, система позволяет анализировать все поступающие события и определять список возможных корневых причин их возникновения. Это в разы сокращает общее количество обрабатываемых администраторами событий, ускоряет первичную диагностику и помогает корректно определить команду, в чьей зоне ответственности находится нештатная ситуация. Во-вторых, решение позволяет определить, насколько корневая причина влияет на предоставление конечного сервиса, т.е. помогает приоритизировать действия ИТ-специалистов».

 

Реализация концепции началась с комплексного обследования ИТ-ландшафта МТС и изучения логики работы информационных систем. Проектная команда совместно с сотрудниками ДОМИС разработала сервисно-ресурсные модели, отражающие зависимости и влияние компонентов прикладного и инфраструктурного уровня на ИТ-сервисы. Были внедрены средства автоматизации процессов мониторинга на базе продукта HP Business Service Management (BSM), разработаны и настроены правила многоступенчатой обработки событий.

 

В контур контроля вошли серверы, системы виртуализации и хранения, активное сетевое оборудование, системное и прикладное ПО, а также СУБД – в общей сложности более 10 тысяч объектов различного типа в 7 макрорегионах. За счет технологии безагентского мониторинга все подключения к объектам мониторинга для сбора показателей их доступности и производительности происходят удаленно. Это значительно ускорило развертывание ЦСМИС в распределенной ИТ-инфраструктуре телеком-оператора.

 

Помимо мониторинга компонентов ИТ-ландшафта, реализован контроль качества ИТ-услуг на стороне абонентов. Для этого применяются механизмы синтетического мониторинга (т.е. эмуляции действий реальных пользователей в информационных системах), что позволяет однозначно определить доступность и производительность этих систем.

 

Обслуживать проще

 

Параллельно с построением системы мониторинга закладывались и возможности для ее удобной и эффективной эксплуатации. Для сотрудников ДОМИС определены и автоматизированы с помощью комплекса программных средств типовые задачи по диагностике и поддержке работоспособности систем. При этом часть рутинных операций, не требующих участия людей, решение способно выполнять самостоятельно. Автоматизация не только ускорила обработку поступающих событий мониторинга, но и существенно снизила риски ошибок при подключении в контур контроля новых ИС любого масштаба. Последнее особенно важно, так как речь идет о тысячах объектов – ручной труд в таких условиях неприемлем.

 

Благодаря собственным разработкам компании «Инфосистемы Джет», интегрированным с продуктами HP, созданы уникальные для российского рынка решения. В частности, модуль загрузки объектов мониторинга (МЗОМ) позволяет настраивать в автоматизированном режиме мониторинг тысяч серверов и сетевых узлов. Для своей работы он использует базу конфигураций – так называемый реестр точек мониторинга, содержащий полную информацию по каждому собираемому показателю (около 27 тысяч метрик). Такой подход помогает избежать пропуска серьезных аварий из-за ошибок и неучтенных программных и аппаратных ресурсов. Кроме того, был внедрен модуль проверки доступности объектов, который контролирует корректность мониторинга имеющихся и готовность к нему новых компонентов инфраструктуры, а также оповещает сотрудников ДОМИС о выявленных проблемах.

 

«Системы автоматизации процессов эксплуатации (так называемые оркестраторы) – для России относительно новое явление. МТС – одна из передовых компаний, в которых данные решения внедрены и реально используются, – поясняет главный конструктор проекта, старший инженер-проектировщик систем управления компании “Инфосистемы Джет” Константин Корниенко. – Нацеленность на результат и готовность к инновациям со стороны руководства ДОМИС позволили нам реализовать в проекте собственные технические идеи, которые не только обогатили функциональность системы мониторинга, но и сократили сроки проекта внедрения».

 

ЦСМИС – коротко о главном:

  • создана за 5 месяцев на базе HP Business Service Management (BSM);
  • охватывает более 10 тыс. объектов различного типа (серверов, систем виртуализации и хранения, активного сетевого оборудования, системного и прикладного ПО, СУБД) в 7 макрорегионах;
  • контролирует состояние ИС класса mission- и business-critical, а также ряд business support систем;
  • поддерживает автоматизированое выполнение регламентных процедур;
  • обеспечивает автоматизированную постановку на мониторинг новых объектов после их внесения в реестр точек мониторинга

 

Подводя итоги

 

Компания МТС получила удобную технологическую платформу для работы Департамента оперативного мониторинга ИС. Максимальная автоматизация позволила контролировать состояние ИТ-сервисов в масштабе страны силами дежурной смены, состоящей всего из 4 специалистов отдела оперативного мониторинга ИС.

 

«Совместно с нашими партнерами нам удалось создать уникальную для российской телеком-отрасли систему мониторинга ИС, позволяющую получать полную картину о состоянии ключевых процессов на всех уровнях во всех регионах присутствия, что существенно повышает надежность бизнес-процессов компании и абонентских сервисов. Тонкая настройка и адаптация ЦСМИС под наши нужды позволила снизить нагрузку на ИТ-подразделения и повысить отказоустойчивость систем за счет максимальной автоматизации рутинных операций, значительного сокращения времени на выявление корневых причин событий и появления возможности проактивного мониторинга, – отмечает директор Департамента оперативного мониторинга информационных систем компании “МТС” Сергей Дубинец. – Таким образом, мы получили ценный инструмент для управления событиями в соответствии с лучшими практиками ITIL, цель которого – исключить возможность нештатных ситуаций, влияющих на стабильность работы ИС».

 

«Высокая результативность данного проекта связана в том числе с максимальной вовлеченностью ИТ-специалистов МТС в процесс внедрения, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Коллеги с готовностью осваивали новые для себя задачи. В результате за короткий срок система стала для них “родной”, что упростило последующую эксплуатацию».

«Мы рады очередному успешному внедрению решения HP Business Service Management (BSM) в крупнейшей российской компании. Уверен, что система, построенная на платформе HP BSM, обеспечит компании МТС эффективное управление корпоративными приложениями, системами и ИТ-инфраструктурой, – комментирует Андрей Кутуков, директор HP Software в России. – В конечном счете, решение поможет оператору существенно повысить качество предоставляемых клиентам услуг».

Уведомления об обновлении тем – в вашей почте

Шерлок против Big Data

Шерлок Холмс: Но я-то не каждый, Ватсон, поймите: человеческий мозг — это пустой чердак, куда можно набить всё, что угодно.

Создание централизованной системы управления ИТ-инфраструктурой Комитета экономического развития, промышленной политики и торговли (КЭРППиТ) Администрации СПб

О заказчике Комитет экономического развития, промышленной политики и торговли (КЭРППиТ) является одним из ключевых органов исполнительной власти Санкт - Петербурга, регулирующих политику экономического развития города. В круг его задач входит ...

Решения Hewlett Packard для защиты информацион ных систем

Современные компании все шире внедряют корпоративные информационные системы (КИС) в свою деятельность. Это позволяет повысить эффективность деятельности за счет использования более оперативной и полной информации внутри компании, а также ...

Эталонная модель НР по управлению информационными услугами

Настоящий документ описывает эталонную модель HP по управлению информационными услугами. Эта модель является ценным средством, доказавшем свою полезность при представлении и описании многих ИТ-процессов, внутрипроцессных отношений и ...

«Облака»: мифы, ландшафт, стратегия

Шум вокруг «облаков» продолжает расти. На этой волне многие производители стремятся показать, что они современны и держат руку на пульсе. В результате почти на всем появляется лейбл «облачно».

Автоматизация процессов эксплуатации ИТ

Что составляет деятельность Системного администратора помимо решения сложных и творческих задач?

Интервью с Александром Клечиковым, начальником отдела информационно-технической поддержки Комитета экономического развития, промышленной политики и торговли Санкт-Петербурга

Александр Клечиков, начальник отдела информационно-технической поддержки Комитета экономического развития, промышленной политики и торговли Санкт-Петербурга, поделился с Jet Info опытом реализации ИТ-проекта в своей компании.

Виртуальные ленточные библиотеки. Мифы и реальность

Современные системы хранения данных (СХД) обеспечивают исключительно высокий уровень надежности хранения благодаря отказоустойчивой архитектуре оборудования, включающей в себя дублирование компонентов, поддержку механизмов RAID и т.д., а также за счет применения средств создания копий данных, моментальных снимков (snapshot) и репликации.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня