Тенденции в мире СХД
СХД, СРК СХД, СРК

Задумавшись над вопросом о современных тенденциях в мире СХД, можно сделать, на первый взгляд, банальный вывод

Главная>СХД, СРК>Тенденции в мире СХД
СХД, СРК Тема номера

Тенденции в мире СХД

Дата публикации:
16.04.2014
Посетителей:
84
Просмотров:
72
Время просмотра:
2.3

Авторы

Автор
Андрей Шапошников Заместитель директора технического центра «Инфосистемы Джет»
Автор
Роман Володин В прошлом - начальник отдела систем хранения данных компании "Инфосистемы Джет"
Задумавшись над вопросом о современных тенденциях в мире СХД, можно сделать, на первый взгляд, банальный вывод: главной тенденцией является то, что объемы данных растут. Поразмыслив еще немного, можно прийти и к другому, уже не такому банальному выводу: данные растут непредсказуемо, а точнее – предсказуемо растут неструктурированные данные.

 

 

Исходя из этих основных тенденций производители оборудования и программного обеспечения, предназначенного для хранения и обработки данных, действуют, пытаясь предложить рынку более быстрые, гибкие решения – технологии, которые можно охарактеризовать словом «более…».

 

Некоторые из них мы с коллегами рассмотрим в нашем номере, но начать хочется с обзора двух, кажущихся нам наиболее знаковыми, обеспечивающими унифицированные и где-то даже универсальные подходы к обмену, хранению и обработке разнородной информации. Мы говорим о «конвергентных» сетях и Больших Данных.

 

Конвергенция на десяти гигабитах

 

Термин «конвергенция» входит в число наиболее употребительных, когда говорят о современных ИТ-решениях – речь идет о конвергенции сетевых протоколов, технологий доступа к данным, ИТ-инфраструктур и т.д. Ее конечный смысл в мире ИТ – уменьшение числа элементов в системе и упрощение задач управления инфраструктурами, что весьма актуально ввиду постоянного роста объемов обрабатываемых данных и повышения требовательности приложений.

Авторы

Одно из направлений конвергенции в ЦОД – переход к единому транспорту для передачи различных типов трафика. Такую возможность сегодня предоставляет технология 10-гигабитного Ethernet (10GbE). Благодаря усовершенствованиям в стандарте, повышению скорости и надежности соединений, а также появившимся возможностям поддержки Quality of Service для критичного трафика 10GbE можно использовать не только для создания вычислительных сетей, но и для подключения дисковых массивов. В противоположность традиции построения в ЦОД двух отдельных сетей – вычислительной сети на базе Ethernet и сети хранения данных (SAN) на базе Fibre Channel (FC) – теперь можно организовать единую конвергентную сеть на основе 10GbE.

 

Такой подход пока еще остается непривычным для большинства потребителей, в том числе в силу организационных моментов. Если раньше за вычислительные сети и сети хранения отвечали разные администраторы, то теперь их функции сливаются, и руководителям приходится принимать непростые кадровые решения.

 

Тем не менее перевод всего сетевого оборудования на единый транспорт – это решение, к которому стоит присмотреться. Оно оправдывает себя в силу упрощения сетевой инфраструктуры (уменьшения количества адаптеров, кабелей, активного сетевого оборудования) и сокращения затрат на эксплуатацию.

 

Как же обеспечить эффективное функционирование этой технологии в компании? Первый шаг на пути к сетевой конвергенции – консолидация ввода/вывода серверов. Интерфейс 10GbE имеется во всем современном серверном оборудовании. Кроме того, сегодня уже не обязательно устанавливать в сервер отдельные адаптеры FC и Ethernet – подключения LAN (Ethernet) и SAN (FCoE, iSCSI) теперь могут осуществляться через единый конвергентный адаптер (Converged Network Adapter, CNA). Современные адаптеры разгружают центральный процессор сервера, избавляя его от обработки сетевых протоколов, это позволяет отдавать все ресурсы приложениям. Более того, в последних поколениях процессоров Intel реализована технология 10GbE LAN On Motherboard (LOM), благодаря которой LAN- и SAN-подключения серверов становятся доступными по умолчанию. На стороне систем хранения интерфейс 10GbE также реализован всеми ведущими вендорами как для файлового, так и для блочного доступа. Конвергенция на уровне доступа позволяет пользоваться преимуществами унифицированного транспорта, не внося изменений в ядро существующих сетей Ethernet и FС.

 

Следующий шаг – конвергенция на уровне ядра сети, которая реализуется на базе высокопроизводительных коммутаторов Ethernet, умеющих одинаково эффективно работать с трафиком LAN и SAN. В случае использования таких решений (их предлагают, например, компании Cisco и Brocade) конечные устройства могут подключаться к сети как через классические порты Ethernet и FC, так и через конвергентные адаптеры и порты систем хранения FCoE.

 

Среда Ethernet уже достаточно давно используется в ЦОД для передачи как блочных (iSCSI), так и файловых (NFS, CIFS) данных. Протокол Fibre Channel поверх 10-гигабитного Ethernet (FCoE), разработанный в свое время, чтобы заменить две сети в ЦОД на одну конвергентную, пока не получил широкого распространения, в частности из-за недостатков классического Ethernet, который не гарантирует доставку трафика без потерь. По этой причине FCoE полноценно работал только на небольших расстояниях. Однако расширения классического функционала Ethernet (так называемые Converged Enhanced Ethernet, CEE, или Data Center Bridging, DCB) позволяют приблизить его характеристики к требованиям сетей дата-центров.

 

Кроме того, меняется сама архитектура сетей ЦОД: прежде она была многоуровневой, теперь предлагаются варианты плоских сетей – так называемых Ethernet-фабрик. А Ethernet-фабрика позволяет пропускать трафик FCoE кратчайшим маршрутом. Возможно, по мере дальнейшего развития технологии Ethernet протокол FCoE сможет найти более широкое применение.

 

Хранилища для Больших Данных

 

В то же время на смену монолитным СХД со сравнительно небольшими возможностями горизонтального масштабирования постепенно приходят кластерные (горизонтально масштабируемые) системы, где множество узлов логически объединяется в единый пул с единым управлением. Узлы кластера связываются между собой высокопроизводительной сетью на базе, например, InfiniBand или 10GbE. Такие системы становятся все более актуальными с распространением облачных сервисов и технологий Больших Данных с многообразием их форматов. Кластерные системы хранения есть сегодня в арсенале всех ведущих производителей.

 

Похожий подход предлагают так называемые программно определяемые системы хранения – Software Defined Storage (SDS). Суть концепции в логическом отделении собственно сервисов хранения от аппаратного обеспечения. В качестве аппаратной составляющей можно использовать, например, стандартные серверы х86, а развернутое на них интеллектуальное ПО будет обеспечивать различный функционал систем хранения – репликацию, дедупликацию, мгновенные снимки и пр. Пример такого решения – ПО Red Hat Storage Server. С его помощью создается, по сути, параллельное объектное хранилище с интерфейсами NAS. Решение масштабируется до петабайтных объемов путем простого добавления серверов. Хранимые данные равномерно распределяются по всей системе, централизованного сервера метаданных нет, и за счет этого обеспечивается быстрый доступ к данным. Использование технологии 10GbE по части скорости доступа приближает такие системы к традиционным монолитным решениям.

 

Системы с параллельной архитектурой постепенно набирают популярность. Но здесь есть и сдерживающие факторы. Например, приложения, архитектура которых не претерпела сильных изменений за последние 10 лет, не могут работать с такими хранилищами. В то же время многие организации привыкли или вынуждены использовать блочный доступ. А реализовать параллельный блочный доступ технически сложно (по крайней мере на нынешнем уровне развития технологий), и даже если это сделать, он в параллельной архитектуре будет медленным. Между тем работа с растущими объемами данных и освоение потенциала Больших Данных требует скорости.

 

Классическое решение для работы с Big Data – Hadoop, которое объединяет в себе технологии распределенного хранения данных и параллельной обработки. В Hadoop и подобных ему решениях адресация происходит не как в обычной файловой системе, а по метаданным – служебной информации о содержимом файла. Похожий подход использовался в свое время в системах хранения с адресацией по содержанию (Content Addressable Storage, CAS), но в объектных хранилищах он перешел в новое качество. CAS не были ориентированы на быстрое извлечение данных, только на их надежное хранение, а объектные хранилища являются высокопроизводительными, что и позволяет использовать их для Big Data. Сегодня принципы объектного хранения реализованы в ряде вендорских решений, например, EMC Atmos или Hitachi Content Platform (НСР).

 

Что дает объектное хранение?

 

Прежде всего возможность быстро находить нужный файл в огромном массиве разнородных данных, чего не может обеспечить традиционный файловый доступ. Означает ли это, что файловый доступ со временем отомрет? Едва ли. Например, потому что в объектное хранилище нельзя положить традиционную базу данных с ее монолитной архитектурой. А вот для разнообразного контента, фотографий, почты, данных телеметрии, журналов событий они будут вполне эффективны.

 

В сущности, объектное хранение и файловый доступ могут неплохо сочетаться друг с другом. На рынке появились платформы корпоративного класса для облачного хранения и удаленного доступа к данным, такие как Hitachi Content Platform Anywhere или NetApp Connect. С их помощью пользователям обеспечивается доступ к файлам, но сами файлы хранятся в объектном хранилище.

 

Такого рода решения уже достаточно давно доступны частным пользователям в виде сервисов Dropbox, Google Drive и тому подобных объектных хранилищ с веб-интерфейсом. Облачные хранилища контента корпоративного класса увидели свет совсем недавно, однако не исключено, что в перспективе корпоративный доступ к файлам будет предоставляться именно по такому механизму, к которому прибавятся улучшенные (по сравнению с общедоступными сервисами) функции безопасности (например, возможность интеграции с существующей службой Active Directory). Пользователям не придется искать нужные файлы в каталогах, они будут находить интересующий их контент на специализированном портале – подобные решения сегодня уже реализуются в виде корпоративных порталов для совместной работы. Одно из преимуществ упомянутых облачных платформ состоит в том, что они используют другие протоколы доступа, которые, в отличие от, например, CIFS, не столь чувствительны к задержкам в сети, поэтому работать с файлами из корпоративного хранилища можно через публичные, в том числе мобильные сети.

 

В заключение хочется отметить, что и конвергенция, и Большие Данные уже не являются на российском рынке чем-то умозрительным. Напротив, примеры успешных внедрений убедительно говорят о том, что эти подходы/решения/технологии находятся в русле современных тенденций развития СХД и рекомендованы к применению в корпоративных ИТ-системах.

Уведомления об обновлении тем – в вашей почте

Exadata - решение для Big Data?

Уже полтора года в нашей компании развернут демо-центр по Oracle Exadata Database Machine, и мы регулярно на различных мероприятиях докладываем о полученных на этом оптимизированном программно-аппаратном комплексе результах.

Построение многоуровневых систем хранения данных: роль Networked Storage Controller

Опыт работы компании «Инфосистемы Джет», подтверждая общие тенденции в области программных и аппаратных средств хранения информации, свидетельствует о том, что традиционные системы хранения данных (СХД) уже не могут в полном объеме удовлетворять ...

Маленькая «серебряная пуля»

Данные – новая валюта бизнеса. Пожалуй, многие согласятся с таким утверждением

На чем стоим

Реализация вычислительного комплекса, сочетающего в себе оперативность, гибкость и надежность предоставляемых ИТ-сервисов, была непростой задачей

Практика применения решений HDS

Мы тесно сотрудничаем со многими производителями систем хранения данных, что позволяет объективно оценивать качество дисковых массивов разных вендоров.

EMC Greenplum в инвестиционном бизнесе

Тройка Диалог - один из лидеров инвестиционно-банковского бизнеса, работающий на рынках России и СНГ. Среди услуг можно перечислить ПИФы, интернет-трейдинг, индивидуальное брокерское обслуживание, доверительное управление, инвестиционное страхование жизни, управление пенсионными накоплениями.

Обзор функционала SDS

Программно-определяемые СХД в виде абстракции над устройствами хранения появились не вчера. Но относительно недавнее появление высокоскоростных ЛВС и достаточных процессорных мощностей (мы подробнее рассматриваем это ниже) позволило реализовать новые подходы к хранению данных, такие как распределенный между серверами Erasure Coding.

«Облачные» решения от EMC

Корпорация EMC в числе первых начала разработку продуктов, предназначенных для построения «облачной» инфраструктуры. В настоящее время EMC является лидером на рынке решений Cloud Ready для СХД.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня