x
© 1995-2019 Компания «Инфосистемы Джет» Разработано в Liqium
Вычислительные комплексы Связанные одной цепью, или Что нам готовит Интернет вещей?
Автор
Редакционный материал
Статей: 6 Фото-факт: 26

436

0.

12

0

3

Сейчас, в понимании Gartner, началась третья волна развития гиперконвегентных систем (Hyperconverged Integrated Systems, HCIS), которая продлится до 2025 г. Для систем третьей волны характерно появление динамичных, легко формируемых ИТ-инфраструктур на основе сетевых фабрик, состоящих из дизагрегированных аппаратных модулей. Такие системы должны быть оптимизированы по экономическим показателям и обеспечивать непрерывную доставку приложений

Прямо на наших глазах происходит технологическая революция. Точнее, мы находимся внутри той революции, которую ИТ-гуру Джеффри Мур метко окрестил технологическим торнадо. Яркий пример происходящей бизнес–трансформации  — события в российском сегменте цифрового банкинга. В частности группа Qiwi собирается реализовать модель мультибанковского обслуживания на базе цифровых активов: «Рокетбанк» и «Точка». Клиенты получат возможность пользоваться всем спектром сервисов, а открывать счет — в одном банке. Группа OTP, владеющая как традиционными банковскими активами, так и онлайн-банком Touch Bank, занялась разработкой универсальной масштабируемой платформы digital-банка, которую собирается предлагать для внедрения в виде готового решения любым классическим банкам.

Характер происходящих изменений однозначно говорит о том, что ключевыми инфраструктурными элементами в ближайшие годы станут цифровые платформы, цифровые экосистемы и, конечно, технологии, обеспечивающие всеобщую связанность всех вещей нашего мира. На эту роль претендуют технологии Интернета вещей (Internet of Things, IoT).

Уже сегодня они пытаются изменить в привычной жизни человечества все: от персонального технологического окружения (например, умные носимые устройства — для медицинских целей, фитнеса, развлечений или товары с электронной «историей производства» в магазинах) до промышленных гигантов. Для производственных применений активно разрабатывается отдельное направление промышленного Интернета вещей (Industrial Internet of Things, IIoT).

 

В целом роль и место коммуникационной составляющей в мире Интернета вещей такова, что перспективную корпоративную ИТ-инфраструктуру будущего вполне можно назвать «Инфраструктурой 2.0». Подробную статью про Интернет вещей читайте на странице 32.

Можно уверенно утверждать, что Инфраструктура 2.0 — это пространство ИТ-услуг на базе разнообразных вариантов беспроводной связи, включая и те, которые некоторое время назад считались уделом научных лабораторий, а сегодня выходят из их стен в прикладную сферу. В первую очередь речь идет о квантовых вычислениях.

 

Исследователи работают над превращением в прикладные решения ряда фундаментальных свойств квантового мира.

 


Квантовую частицу невозможно перехватить, подобно блоку цифровых данных, — в ходе такой операции она исчезает. Этот принцип используется при создании абсолютно защищенных каналов связи.

 


Принцип квантовой запутанности: подразу­мевается, что можно определенным образом «спутать» между собой две частицы—так, что, даже находясь друг от друга на любом расстоянии, они будут вести себя идентично: если меняется состояние одной частицы, мгновенно меняется и состояние другой. Соответствующее прикладное решение для сферы телекоммуникаций получило название квантовой телепортации — подразумевается бесканальный способ передачи данных, в основе которого лежит эффект квантовой запутанности.

 

Фактически речь идет о возможности мгновенно телепортировать информацию о состоянии какого–либо объекта в любое место, если разместить спутанные частицы в нужных местах на конкретных территориях, где нет привычных средств связи: базовых станций, оптоволоконных или спутниковых каналов связи. И эту информацию будет невозможно взломать, украсть и расшифровать. На рис. 1 представлена схема квантовой коммуникационной инфраструктуры.

 

По экспертным оценкам, переход на квантовые системы безопасности произойдет уже в ближайшие 5–8 лет, а в течение ближайших 10–15 лет сформируется новый большой сегмент телеком-рынка. Можно прогнозировать, что между разработчиками развернется борьба за статус международного стандарта.

 


Один из самых масштабных проектов такого рода в мире идет в России: университет
ИТ­МО и поволжский оператор связи «СМАРТС» в прошлом году начали проект создания магистральной квантовой телекоммуникационной сети в европейской части России. Планируется разворачивание телекоммуникационных узлов и ЦОДов, оснащенных квантовыми технологиями, которые обеспечат новое качество связи и ИТ-инфраструктур, он кратко представлен на рис. 2.

 

Внедрение гибридных технологий добавит к существующей инфраструктуре связи новые квантовые части, способные кардинально изм енить облик предоставляемых потребителям услуг. Сегодня идет речь о 100-процентной защите VIP-банкинга и каналов передачи персональных генетических данных, а также о дистанционных выборных технологиях.

 


Конечно, традиционные сетевые технологии продолжают активно развиваться. Например, наши старые знакомые — сети Wi-Fi — за 20 лет своего существования смогли увеличить скорость передачи данных в 20 раз и стали поддерживать передачу HD-видео и других высоконагруженных приложений. Не удивительно, что, по оценкам аналитиков, более половины глобального трафика Интернета сегодня осуществляется через точки доступа сетей Wi-Fi. А впереди новый виток развития — сети Wi-Fi становятся не только быстрее, но и умнее.

 


Пример — решение Jet Toolbar, которое превращает привычные сервисы связи в персонализированные коммуникации, настраиваемые на конкретные целевые аудитории.

 


Прочитать статью о Jet Toolbar можно на странице 116.
Появление на рынке решения Jet Toolbar отражает глубинные процессы трансформации, идущие в недрах операторского сообщества, — поиск новых бизнес-моделей предоставления услуг с добавленной потребительской ценностью (Value Added Services) в кооперации с компаниями-партнерами. Еще одно проявление данного тренда — усиление интереса участников рынка к работе по модели виртуального оператора связи (MVNO).

 


Причины роста интереса к этому тренду, во-первых, в усилении конкуренции, заставляющей компании искать новые доходные услуги и сервисы, и, во-вторых, в технологических прорывах последних лет. Фактически только сейчас в реальный бизнес начинают проникать апробированные коммерческие решения аналитики Big Data, которые дают возможность строить по-настоящему персонализированные и по-настоящему умные digital-коммуникации с клиентами, работающие на основе детальных достоверных знаний об их интересах и потребностях.

 


Результат — заметное оживление на рынке MVNO в РФ. Так, в конце ноября 2017 г. в России начал работу виртуальный оператор, действующий под брендом Virgin — этот шаг стал развитием российского бизнеса международного оператора фиксированной связи «Тривон», который работает в нашей стране под брендом Virgin Connect еще с 2007 года. А в декабре 2017 года о запуске MVNO-проекта Тинькофф Мобайл объявил Олег Тиньков.

 

Действительно, где еще, как ни в сочетании телекоммуникационных и финансовых услуг можно достичь необыкновенно результативной бизнес-синергии?
Подробную статью о Тинькофф Мобайл читайте на странице 66.

 


Впрочем, прогнозируется проникновение MVNO и в другие отрасли деятельности, например, в транспорт, в розничную торговлю. Проблема ограниченности целевой аудитории для некоторых ниш будет решаться с помощью запуска виртуального оператора специфического типа: MVNE (Mobile Virtual Network Enabler). Фактически это агрегатор, который работает с различными сетевыми операторами и предоставляет услуги нишевым пользователям, как индивидуальным, так и корпоративным.
Именно механизм MVNE оператор связи Tele2 решил использовать для агрессивного продвижения на рынке РФ. В первой половине декабря компания объявила о запуске собственной платформы MVNE, включающей набор обязательных компонент телеком-систем: биллинг, CRM, интерфейсы с абонентами и т.п. Эта платформа позволит любым сторонним компаниям запускать собственных виртуальных мобильных операторов на базе сети Tele2.

При переводе 9 высоконагруженных баз данных системы биллинга одного оператора связи на All–Flash–массив удалось в 2 раза повысить производительность и в 8 раз сократить задержку доступа к данным. Это в свою очередь в 4 раза уменьшило время закрытия расчетного дня, а технологическое время на процесс резервирования также сократилось почти вдвое. Кроме того, упростилась реализация нового функционала, так как мощности системы достаточно для более глубокой аналитики и поддержки изменений. Таким образом, при переходе на All–Flash бизнес получил запас производительности, возможность развивать свои сервисы и не переживать о растущих потребностях СХД.

Железный век ИТ
уходит в облака

«Облака» постепенно уходят из новостных заголовков в рутину будней ИТ-департамента. Однако не стоит считать эту тему исчерпанной при анализе длительных трендов. Как показывают результаты недавнего исследования Selectel и iKS Consalting «Миграция в облако: анализ текущей ситуации в России», в каждой четвертой организации РФ все сотрудники в том или ином виде применяют облачные технологии в повседневной работе. Однако большинство респондентов (65%) при этом имеют в виду виртуализированную инфраструктуру, развернутую на своей корпоративной площадке. Наибольшее количество виртуальных машин (10–15 тыс. на одного заказчика) ожидаемо используется в наиболее продвинутых с точки зрения ИТ-областях: телекоме, финансовом секторе и собственно ИТ.

 

Этот факт объясняет популярность модели гибридного облака — все больше потребителей склоняется к гибридной модели, а 20% уже перешли на эту модель. Не отказываясь от использования существующих вычислительных мощностей на собственной площадке, они начинают экспериментировать с публичными облаками, перенося туда наименее критичные приложения или гибко подключая новые ресурсы, скажем, на время проведения рекламных кампаний или иных специальных мероприятий.
Проблема оптимального выбора между XaaS (арендой каких-либо ресурсов) и виртуализацией локальной инфраструктуры будет одной из горячих в среднесрочной перспективе.

 

Наиболее существенный тренд в развитии локальной инфраструктуры на собственной площадке связан с развитием гиперконвергентной архитектуры. В 2017 г. рынок стал заполняться новыми коммерческими игроками, что подтолкнуло рост продаж. Они подскочили на 64,7% сразу в I квартале 2017 г., а гранды отрасли, в первую очередь, Dell EMC и HPE, приступили к выводу на рынок нового поколения вычислительной архитектуры.

 

Основная цель — создать унифицированную инфраструктуру с высоким уровнем интеграции, позволяющую сократить трудозатраты на ее сопровождение и сосредоточиться на качестве ИТ-сервисов.

 

В целом идея неограниченной интеграции подпитывает движение индустрии в течение последних лет: вначале — к конвергентным решениям (интегрированным, оптимизированным для рабочих нагрузок системы, протестированным в заводских условиях), затем — к гиперконвергентным, в которых многие функции становятся программно-определяемыми. На рис. 3 представлены основные этапы, которые проходят компании по пути миграции в сторону гиперконвергентной ИТ-архитектуры.

 

Аналитики Gartner понимают под гиперконвергентным решением платформу с общими программно-конфигурируемыми (software-defined) вычислительными ресурсами и ресурсами хранения. Причем эта платформа использует стандартное оборудование (x86) и унифицированный интерфейс управления.

 

Понятно, что самым ценным элементом гиперконвергентного решения оказываются программные инструменты управления всей системой. Они и определяют направление будущего развития сегмента в обозримой перспективе.

 

Необычайно привлекательная идея: управление из единой консоли полным пулом интегрированных сетевых ресурсов, обеспечивающих функционал вычисления и хранения, а также инструментов управления этими ресурсами. Фактически владельцу такой инфраструктуры остается только установить необходимые приложения и пользоваться полученными благами: снижением затрат на развертывание и эксплуатацию гиперконвергентной среды и простого масштабирования путем добавления в инфраструктуру стандартных узлов х86 по мере необходимости. Отдельной вишенкой на торте смотрится обещание интегрировать оборудование и ресурсы различных производителей, но это — дело будущего.

Регрессия предполагает предсказание некоторого значения: например, сумму чека клиента, или износостойкость материала, или количество километров до первой поломки автомобиля.

В качестве математической метрики, которую оптимизируют алгоритмы машинного обучения (функция потерь), используют разность между предсказанием модели и истинным значением. Но если за метрику взять сумму отклонений, при одинаковом количестве отклонений в обе стороны, эта сумма будет равна нулю и не покажет реальной ошибки. Поэтому обычно используют среднюю абсолютную (сумма абсолютных значений отклонений) или среднюю квадратичную ошибку (сумма квадратов отклонений от истинного значения). Иногда рассматривают более сложную формулу, логарифмируя или извлекая квадратный корень из этих сумм. Все эти метрики могут показать, как стала считать модель: лучше или хуже, — но для их использования этот результат надо еще с чем-то сравнить.

Хорошо, когда есть уже построенная модель и можно сравнить с ней. А что делать, если модель строится впервые? В этом случае часто используют коэффициент детерминации, или R2. Коэффициент детерминации выражается как единица минус отношение средней квадратичной ошибки модели к средней квадратичной ошибке среднего значения тестовой выборки.

Иными словами, коэффициент отвечает на вопрос, насколько модель лучше предсказывает. Отметим, что иногда ошибка в одну сторону неравнозначна ошибке в другую. Например, в модели, предсказывающей заказ товара на склад магазина, заказать чуть больше не страшно — он останется на складе, а вот нехватка товара приведет к потере покупателей. В этом случае используют квантильную ошибку, где положительные и отрицательные отклонения от истинного значения учитывают с разными весами.

Конечно, немаловажную роль в становлении индустрии HCIS сыграли успехи в совершенствовании серверов: в них можно разместить гораздо больше дисковой емкости, процессорных ядер, оперативной памяти для поддержки как служебного ПО, так и продуктивной нагрузки. Современный функционал репликации (копирования) данных на несколько узлов кластера HCIS дает радикальный прирост отказоустойчивости, поскольку допустим выход из строя сразу нескольких компонентов одновременно без прерывания доступа к данным.

 

Существенно выросла также скорость интерконнекта между серверами: 10 Гбит/c — это уже норма, которой достаточно для широкого круга бизнес-задач.

 


Гиперконвергентные платформы находятся в мейнстриме процессов создания ИТ-инфраструктуры 2.0: они непрерывно совершенствуются и в конечном итоге будут воплощать концепцию «ИТ как услуга» (IT as a service, ITaaS), предоставляя соответствующие сервисы бизнесу, разработчикам и корпоративным пользователям.

 

При всех замечательных свойствах HCIS — не волшебная палочка для ИТ-инфраструктуры. Секрет здесь кроется в архитектуре гиперконвергентных решений — в основе лежит платформа виртуализации. И если требуется высокая производительность подсистемы хранения данных для сервисов, расположенных на физических серверах (чаще всего это Power и SPARC-системы), здесь не обойтись без All-Flash-массивов. Подробную статью о гиперконвергентных решениях читайте на странице 70.

 

Сфера хранения данных также не остается без изменений. По версии IDC, объем данных в мире с 2013 по 2020 г. увеличится в 10  раз — до 44 трлн гигабайт (4,6 зетабайт ), а соответствующий рынок достигнет 92 млрд долл. Примерно половину этой «вселенной битов» составляют так называемые «холодные» данные, которые нужно хранить долго, при этом обращаются к ним крайне редко.

 


Кроме роста объемов происходит гораздо более страшная вещь — рост количества файлов, переход от структурированных данных к неструктурированным. Если проблема объемов решается более емкими и недорогими носителями, то хранение миллиардов файлов и поиск по ним представляет собой сложнейшую задачу.

 

На помощь приходит модель объектного доступа. Каждый законченный кусочек данных — объект c собственными характеристиками (метаданными), имеющий адрес. Поиск по таким объектам может осуществляться параллельно и гораздо быстрее, чем в файловых системах. Проблема объектных хранилищ — плохая интеграция с бизнес-приложениями. Их использование почти всегда сопровождается дополнительными затратами на внедрение.

 


Раньше только гиганты испытывали проблемы с большим количеством файлов. Мы осуществили несколько проектов по внедрению объектного доступа для операторов связи и топ-банков. Однако теперь с этим встречается и средний бизнес. Поэтому мы прогнозируем уменьшение порога вхождения в мир объектов и повсеместное внедрение объектных массивов.

 


Если говорить о «горячих» данных, то их также становится все больше. Аналитика становится все сложнее, анализ охватывает больше данных и делается чаще, чем раньше. Бизнес хочет постоянно знать о положении дел с помощью IT-систем. Это приводит к огромным требованиям к производительности на единицу объема.

 

В таких случаях экономически выгодным становится вариант All-Flash: диски такого типа позволяют получить комбинацию высокой производительности (от 100K IOPS до нескольких миллионов) и экстремально низкой задержки (менее 1 мс) практически на любом количестве данных. Иными словами, бизнес может получать данные чаще, реализовывать более сложный функционал, не переживая постоянно о СХД.

Мягкая сила в ИТ

По всему ИТ-ландшафту сегодня перешли в активное наступление программно-определяемые (Software Defined) подходы. Например, при внедрении такой системы хранения заказчик получает более низкую стоимость дисков и техподдержки, а также большую гибкость хранения. Это дает возможность закупать ресурсы хранения более экономичным способом по сравнению с традиционным.

 


Самое значительное достижение владельца такого хранилища заключается, во-первых, в том, что СХД может эффективно и надежно работать с дисками различных поставщиков, и, во-вторых, это могут быть диски недорого уровня, доступные для приобретения на открытом рынке.

 


В программно-управляемых сетях (Software Defined Network, SDN) управление передается в программируемую часть сети, а за непосредственную диспетчеризацию трафика отвечают управляемые программой устройства. Таким образом, собственно управление работой сети отделяется от рутинной работы по перекачиванию данных.

 


Таким образом, принцип программной определяемости Software Defined предполагает переход от жесткой архитектуры hardware к программируемой, которая обещает обеспечивать динамичность и высокую экономическую эффективность.

 


К числу ключевых направлений развития территориально-распределенных сетей, безусловно, относятся решения SD–WAN (Software-Defined networking in a Wide Area Network). Для них основополагающими являются два понятия: SDN (программное управление сетей) и NFV (Network Functions Virtualization, виртуализация сетевых функций). Вместе они позволяют представить корпоративную распределенную сеть как единую унифицированную инфраструктуру с центральным управлением. При этом удаление или добавление новых объектов и сетевых функций становится достаточно простым делом.

 


Появление SD–WAN по праву можно считать настоящим революционным событием, ведь в сетях SD–WAN под управлением оказывается вся сеть, а не отдельное оборудование. Технологии SDN и NFV дают возможность быстро и эффективно перестраивать сетевые компоненты, формировать независимые логические сети на основе общего пула физических устройств, создавать цепочки сервисов и заменять специализированные программно-аппаратные устройства более экономичными устройствами стандартной архитектуры. Кроме того, решения SD–WAN также позволяют «бесшовно» объединять каналы Интернета и MPLS. Приятное следствие — возможность сократить затраты на аренду дорогостоящих VPN-каналов операторов связи.

 


Многие эксперты полагают, что именно сети SD–WAN являются основой всех многообразных проявлений цифровой трансформации предприятий в эпоху всеобщей связности в ИТ–инфраструктуре 2.0. Подробную статью о технологии SD–WAN читайте на странице 44.

Вывод

Таким образом, сегодня мы можем видеть ключевые направления развития корпоративной ИТ-инфраструктуры в перспективе 7–10 лет и в соответствии с ними планировать проекты модернизации инфраструктуры. Современные ИТ, ориентированные на задачи повышения гибкости, масштабируемости и большей простоты управления, помогут пройти этот путь тем способом, который наиболее удобен для конкретной компании. Другая серьезная задача — обеспечить в процессе создания ИТ–инфраструктуры 2.0 поддержку наиболее эффективных средств обработки корпоративных данных. Перспективные подходы и методы решения этой задачи, которая, по сути, оказывает ключевое влияние на бизнес-результаты, посвящена отдельная статья на странице 38.

Екатерина Сюртукова

Руководитель направления сервиса и аутсорсинга ИБ Центра информационной безопасности компании «Инфосистемы Джет»

Комментарий

Услуги Jet CSIRP по подключению к ГосСОПКА

Данные метрики позволяют оценивать уже состоявшееся разбиение по классам, а большинство моделей предсказывают вероятность отношения модели к определенному классу. И в этом разрезе можно варьировать порог вероятности, относительно которого будут определяться элементы в один или другой класс (например, клиентов, которые уходят с вероятностью менее 70%, считаем остающимися). Если конкретный порог не задан, чтобы учитывать эффективность модели, рисуют график зависимости метрик от разного порога (ROC-кривая или PR-кривая [1]) и в качестве метрики рассматривают площадь под этой кривой (рис. 3).

Для выполнения требований № 187-ФЗ необходимо:

Если из 100 застрахованных страховой случай происходит только у 7, модель, которая просто предсказывает всем отсутствие страхового случая, будет иметь точность 93%, не имея никакой предсказательной силы.

В зависимости от специфики задачи рассматривают метрики полноты (количество правильно определенных объектов класса среди всех объектов данного класса) и точности (количество правильно определенных объектов класса среди всех объектов, которые данная модель отнесла к данному классу). Если стоит задача учитывать одновременно полноту и точность, рассматривают среднее гармоническое между этими величинами (F1-мера).

Трудности перевода

Для оптимизации моделей удобно использовать метрики машинного обучения, которые не находят понимания у бизнеса.

 

Довольно сложно транслировать площадь под ROC-кривой модели определения тональности комментария в конкретные суммы выручки. В этом смысле перед бизнесом встают две задачи: как измерить эффект? как максимизировать эффект? С первой задачей все несколько проще, при наличии ретроспективных данных и при условии, что остальные факторы можно нивелировать или измерить.

В этом случае получаемые значения сравнивают с аналогичными ретроспективными данными. Но и здесь есть проблема: с одной стороны, выборка должна быть репрезентативной, а с другой — максимально похожей на ту, на которой происходит апробация модели.

 

Пример: мы должны найти наиболее похожих клиентов, чтобы убедиться, что средний чек у них увеличился, но при этом клиентов должно быть достаточно, чтобы избежать выбросов, т.е. нестандартного поведения. Для решения этого вопроса можно заранее зафиксировать достаточно большую группу близких друг к другу клиентов и оценивать результат на ней в целом. Но тут встает вопрос: как перевести выбранную метрику в функцию потерь (минимизацией которой и занимается модель) для машинного обучения? Этот процесс может быть долгим — он требует погружения разработчиков моделей в бизнес-процессы. Но если в обучении использовать метрику, зависящую от бизнеса, качество моделей сразу вырастает. Например, если модель предсказывает уходящих клиентов, в качестве бизнес-метрики можно использовать график, где по одной оси отмечено количество клиентов, работать с которыми советует модель, а по другой — общее количество денег, которое эти клиенты должны увести.

 

С помощью такого графика бизнес-заказчик может выбрать удобную для себя точку и работать с ней. Этот график линейными преобразованиями сводится к PR-кривой (кривой, где по осям отмечены точность и полнота), что оптимизирует площадь под этой кривой одновременно с бизнес-метрикой.

При этом некоторые классы могут быть хорошо различимы между собой, а некоторые нет. После построения классификаторов можно понять, каких пользователей модель умеет отличать, и уже ставить перед бизнесом задачу: как работать с такими пользователями (теми, кого мы научились отличать).

Следите за нашими обновлениями

Спасибо!
Ваш материал отправлен.
Мы с вами свяжемся
Предложить
авторский материал
Спасибо!
Вы подписались на обновления наших статей
Подписаться
на рубрику
Спасибо!
Ваша заявка отправлена.
Мы с вами скоро свяжемся.
Оформить
подписку на журнал
Спасибо!
Вы подписались на наши новости.
Оформить
подписку на Новости
Ваш комментарий отправлен.
После прохождения модерации комментарий будет опубликован на сайте.
Оставить
комментарий
Спасибо!
Ваша заявка отправлена.
Мы с вами скоро свяжемся.
Задать вопрос
редактору

Оставить заявку

Мы всегда рады ответить на любые Ваши вопросы

* Обязательные поля для заполнения

Спасибо!

Благодарим за обращение. Ваша заявка принята

Наш специалист свяжется с Вами в течение рабочего дня