Интеллектуальная сеть хранения данных
СХД, СРК СХД, СРК

Главная>СХД, СРК>Интеллектуальная сеть хранения данных
СХД, СРК Тема номера

Интеллектуальная сеть хранения данных

Дата публикации:
21.04.1998
Посетителей:
184
Просмотров:
150
Время просмотра:
2.3
Объемы данных, которые хранят и обрабатывают современные организации (даже не самые крупные), измеряются сотнями гигабайт и продолжают быстро расти. Это значит, что нужно не только наращивать количество и емкость носителей, но и повышать скорость доступа к ним. Дополнительные проблемы вызывает то, что данные оказываются распределенными по разным видам носителей и различным компьютерным платформам.

 

По существу организации оказываются втянутыми в “гонку накопителей”, начиная которую целесообразно убедиться, что избранный путь не приведет в тупик, то есть не потребует коренной перестройки информационной системы и не вызовет постоянно растущих затрат.

 

Видимо, пришло время рассматривать данные не как нечто, располагающееся на периферийных устройствах вычислительных машин, а как самостоятельный ресурс, нуждающийся в надежном хранении и централизованном управлении, разделяемый разнородными приложениями и имеющий жизненный цикл, по продолжительности значительно превышающий время жизни компьютерных платформ. Соответственно, и на устройства долговременной памяти нужно смотреть как на относительно самостоятельные аппаратно-программные продукты, подчиняющиеся тем же законам, что и другие компоненты корпоративных информационных систем.

 

Одно из перспективных решений описанных выше проблем предлагает компания Sun Microsystems в рамках программы создания интеллектуальных сетей хранения данных (Intelligent Storage Network, ISN), которой и посвящена настоящая статья.

 

2. Требования к корпоративной системе хранения данных

 

Прежде чем переходить к изложению конкретных подходов и решений, сформулируем требования к современным корпоративным системам хранения данных.

 

Эти требования можно разбить на следующие группы:

 

Эффективность. В данном контексте эффективность средств хранения данных характеризуется тремя показателями:

 

  • емкость (Гб);
  • скорость обмена (Мб/с);
  • количество операций ввода/вывода в секунду.

 

Масштабируемость. Здесь имеется в виду возможность экономичного повышения эффективности по мере возрастания корпоративных требований.

 

Высокая доступность. Требуется обеспечить как бесперебойную работу накопителей, так и их сопряжение со средствами резервного копирования, гарантирующими долговременную сохранность данных.

 

Способность к экономически оправданному эволюционированию вместе с другими компонентами информационной системы.

 

Открытость, следование принятым стандартам, возможность обеспечения поддержки перспективных стандартов.

 

Прозрачность доступа. Приложения должны единообразно работать с данными, независимо от платформы хранения и платформы исполнения.

 

Управляемость. Под управляемостью здесь понимается простота установки, экономичность и простота эксплуатации. Последнее требование может быть выполнено только при наличии средств централизованного управления системой хранения данных, позволяющих производить мониторинг производительности системы, переконфигурирование и другие административные процедуры.

 

Прочие технические требования:

 

  • возможность разнесения накопителей на значительные расстояния;
  • дешевизна кабельного хозяйства;
  • нечувствительность к электромагнитным помехам.

 

В последующих разделах мы увидим, насколько решение Sun Microsystems удовлетворяет сформулированным требованиям.

 

3. Архитектура решения от Sun Microsystems

 

Можно выделить следующие идеи, положенные в основу подхода компании Sun Microsystems к проблеме хранения корпоративных данных:

 

  • применение высокоскоростных сетевых технологий к организации системы хранения данных;
  • применениеинтеллектуальныхсерверовхранения данных для обеспечения разделения данных между разными компьютерными платформами;
  • модульность компонентов системы хранения данных;
  • обеспечение централизованного управления данными.

 

Рис. 1. Архитектура сети хранения данных.

 

Центральной, безусловно, является концепция “сети хранения данных”, являющейся по сути сетью в сети (рис. 1).

 

сеть хранения данных может включать узлы различных типов:

 

  • серверы;
  • дисковые системы;
  • системы иерархического хранения данных;
  • ленточные системы и другие.

 

Сетевая организация хранения данных позволяет кардинальным образом решить такие традиционно трудные проблемы, как масштабирование накопителей и обеспечение их высокой доступности. В интеллектуальной сети хранения данных Sun Microsystems сняты или по крайней мере значительно смягчены обременительные ограничения на число накопителей, присущие интерфейсу SCSI. Наличие избыточных каналов позволяет сохранить работоспособность при выходе из строя одного из них. Выделение подсистемы хранения в отдельную высокоскоростную сеть позволяет сконцентрировать в ней чрезвычайно мощные потоки “сырых” данных между серверами и накопителями, разгружая тем самым корпоративную магистраль и способствуя сбалансированной работе всей сети.

 

На канальном уровне в сети хранения данных ISN используется протокол Fibre Channel. Над ним могут выполняться протоколы более высокого уровня — например, SCSI или IP. При использовании протокола SCSI все устроено привычным образом — есть контроллеры, к которым через оптоволоконные кабели подключены дисковые и ленточные накопители. Встроенное программное обеспечение, поддерживающее SCSI, остается без изменений, “только”, помимо перечисленных выше достоинств, пропускная способность каналов возрастает до 100 Мб/с и более.

 

Применение интеллектуальных серверов хранения позволяет решить очень важную задачу совместного использования данных компьютерными платформами разных поколений. Интеллектуальный сервер умеет понимать различные форматы данных и преобразовывать их к требуемому виду. В настоящее время компания Sun Microsystems предлагает интеллектуальный сервер хранения A7000, способный обеспечить разделение данных между мэйнфреймами IBM и современными открытыми системами, но здесь важно не столько конкретное решение, сколько подход.

Модульность компонентов системы хранения обеспечена как для накопителей, так и для активного оборудования сети хранения данных — концентраторов и коммутаторов. К сети хранения данных можно добавлять целые группы накопителей и отдельные дисковые массивы, можно увеличивать число приводов в рамках одного массива. Таким образом, у заказчика есть возможность выбрать оптимальный масштаб изменений, наращивая или перестраивая только необходимые компоненты. Модульность в применении к ISN означает и возможность горячей замены отказавших компонентов при сохранении работоспособности сети хранения данных в целом.

 

Компания Sun Microsystems предлагает весь спектр накопителей, обслуживающих оперативное хранение и архивирование, так что ISN оказывается полным, модульным, масштабируемым решением.

 

Необходимость обеспечения централизованного управления данными — оборотная сторона распределенной, разнородной природы современных корпоративных систем хранения. По данным IDC, из общего объема памяти (500 000 Тб), который будет выпущен в 2000 году, 75% получит централизованное управление. Учитывая эту тенденцию, компания Sun Microsystems разрабатывает Enterprise Storage Manager (ESM) на Java-платформе. Другие известные продукты, такие как Enterprise NetBackup и Volume Manager, также переводятся на Java.

 

4. Стандарт Fibre Channel

 

Fibre Channel — это стандарт на последовательные (оптоволоконные) соединения, предназначенные для высокоскоростных двусторонних коммуникаций по схеме “точка-точка” между серверами, накопителями рабочими станциями и (что очень важно) концентраторами и коммутаторами.

 

Ключевыми характеристиками протокола Fibre Channel являются:

 

  • полоса пропускания в 100 Мб/с (это в 2.5 раза больше, чем у SCSI);
  • расстояния между узлами до 10 км;
  • масштабируемость за счет использования топологии кольца с арбитрацией.

 

Введение топологии кольца с арбитрацией (Fibre Channel Arbitrated Loop, FC-AL) явилось важнейшим усовершенствованием стандарта Fibre Channel, специально предназначенным для сетей хранения данных. Простейший пример кольца, содержащего сервер, накопитель и концентратор, приведен на рис. 2.

 

Рис. 2. Простейший пример кольца с арбитрацией.

 

С помощью нескольких концентраторов можно строить более сложные конфигурации, подобные той, что изображена на рис. 3.

 

Рис. 3. Соединение нескольких колец с арбитрацией.

 

Физически кольцо с арбитрацией представляется в виде звезды, в центре которой располагается концентратор или коммутатор — устройства, привычные для сетей, но новые для мира накопителей (рис. 4).


При использовании концентраторов полоса пропускания в 100 Мб/с делится между всеми узлами кольца, в то время как каждый порт коммутатора предоставляет “свои” 100 Мб/с. Это значит, что, применяя коммутаторы и несколько контроллеров, можно наращивать полосу пропускания к мощным серверам, распараллеливая обращения к накопителям (рис. 5).

 

Рис. 4. Реализация кольца с арбитрацией с помощью концентратора или коммутатора.

 

Начало выпуска коммутаторов FC-AL запланировано на 1998 год.


У технологии FC-AL есть и другие немаловажные достоинства:

 

  • в одно FC-AL-кольцо можно включить до 127 узлов;
  • FC-AL поддерживает различные формы избыточности, такие как резервирование каналов,
  • FC-AL поддерживает горячую замену отказавших компонентов и динамическое переконфигурирование.


Поучительно проследить, как компания Sun Microsystems постепенно внедряла технологию Fibre Channel в свои устройства (рис. 6). Первоначально устройства использовали исключительно протокол SCSI. В SPARCstorage Array от хоста к контроллеру вел канал Fibre Channel с пропускной способностью 25 Мб/с; диски подключались к контроллеру по интерфейсу SCSI. В устройствах нового поколения, таких как Sun StorEdge A5000, Fibre Channel (100 Мб/с) обслуживает весь путь от хоста до дисков.

 

Рис. 5. Использование коммутатора FC-AL для повышения пропускной способности каналов между сервером и накопителями.

 

 

Рис. 6. Внедрение технологии Fibre Channel.

 

 

Рис. 7. Конфигурации с одним и двумя кольцами FC-AL.

 

При использовании двухпортовых накопителей и хостов с двумя адаптерами Fibre Channel, появляется возможность построения подсистемы хранения данных с двумя кольцами FC-AL (рис. 7). В зависимости от требований к доступности и к пропускной способности, второе кольцо может использоваться как резерв или как средство повышения эффективности.


Помимо содержательных достоинств, у технологии Fibre Channel имеются и более формальные плюсы: стандартизованность и поддержка ведущими производителями. Fibre Channel описывается серией национальных американских и международных стандартов. В число компаний, поддерживающих Fibre Channel, помимо Sun Microsystems, входят Hewlett-Packard, Digital, Compaq и другие. Так что технология Fibre Channel представляется весьма перспективной со всех точек зрения.


5. Дисковый массив Sun StorEdge A5000


5.1. Основные характеристики Sun StorEdge A5000


Sun StorEdge A5000 — это новый дисковый массив производства компании Sun Microsystems. При его разработке ставились следующие цели:

 

  • обеспечение большой емкости при одновременной гибкости в конфигурировании;
  • обеспечение высокой доступности;
  • масштабируемость;
  • экономичность.


Один массив может содержать от 5 до 14 дисков емкостью 9.05 Гб каждый. Как несложно подсчитать, емкость всего массива при этом лежит в диапазоне от 45 до 127 Гб. Sun StorEdge A5000 выпускается в настольном и кабинетном исполнении. В последнем случае можно объединить в одной стойке 4 массива и 2 концентратора FC-AL, достигая емкости примерно в 510 Гб. Наконец, имеется возможность объединения нескольких стоек в конфигурацию с суммарной емкостью более 12 Тб. Приведенные цифры свидетельствуют не только о емкости, гибкости и масштабируемости Sun StorEdge A5000, но и о практичности его архитектуры, позволяющей весьма точно, без существенного “перебора”, подбирать требуемый объем памяти.


5.2. Архитектура Sun StorEdge A5000


Sun StorEdge A5000 — это дисковый массив, целиком построенный на технологии Fibre Channel. Основными компонентами Sun StorEdge A5000 являются (см. рис. 8):

 

  • материнская плата;
  • одна или две (передняя и/или задняя) панели для подключения накопителей;
  • дисковые накопители;
  • интерфейсные платы с двумя разъемами FCAL на каждой;
  • модуль передней панели для управления/диа-гностики;
  • источники питания, вентиляторы и т.п.


Для подключения дискового массива к серверу используется интерфейсная плата FC-AL, выполненная в стандарте SBus или PCI. Эта плата содержит два независимых порта Fibre Channel, каждый из которых способен функционировать в полнодуплексном режиме на скорости 100 Мб/с.

 

Рис. 8. Архитектура дискового массива Sun StorEdge A5000.

 

 

Рис. 9. Кластерная конфигурация с двумя кольцами FC-AL.

 

 

В архитектуре Sun StorEdge A5000 изначально заложены решения, способствующие надежности, готовности и обслуживаемости дискового массива. В Sun StorEdge A5000 нет внутренних кабелей. Дисковые накопители подключаются через разъемы, к которым подведены питание и управляющие сигналы. Тем самым реализуется технология единого подключения (Single Connector Attachment, SCA), совместно разработанная компанией Sun Microsystems и производителями дисков.


Каждый дисковый накопитель в Sun StorEdge A5000 является двухпортовым, благодаря чему их можно подключать к серверу как по одному, так и по двум кольцам FC-AL. При использовании концентраторов Fibre Channel может быть образована кластерная конфигурация (рис. 9).


Поверх протокола FC-AL используется набор команд SCSI-3. Sun StorEdge A5000 поддерживает системные сервисы SCSI (SCSI Enclosure Services, SES), что позволяет контролировать состояние всех компонентов массива как локально, так и на сервере. Sun StorEdge A5000 интегрирован с диагностическими средствами SunVTS и Solstice SyMON.


Разумеется, в Sun StorEdge A5000 поддерживаются такие ставшие стандартными возможности, как различные уровни избыточности накопителей (RAID 0, 1, 0+1, 5), автоматическое определение отказавшего компонента и его замена в “горячем” режиме и т.п.


5.3. Количественные показатели Sun StorEdge A5000


Дисковый массив Sun StorEdge A5000 демонстрирует весьма высокие показатели производительности как на последовательности коротких операций ввода/вывода, так и на длинных обменах. За секунду может быть выполнено 10 тысяч некэшированных операций чтения/записи двухкилобайтных блоков. В “установившемся” режиме скорость обмена составляет 95 Мб/с. При использовании подключения по двум кольцам может быть достигнута пиковая производительность 190 Мб/с.

 

 

Табл. 1. Протестированные конфигурации серверов хранения.

 

 

В табл. 1 сведены данные о тестировавшихся конфигурациях серверов Ultra Enterprise с дисковыми массивами Sun StorEdge A5000. Представляется, что в подавляющем большинстве случаев продемонстрированный уровень масштабируемости более чем достаточен.

 

Высоки и декларируемые показатели надежности. Среднее время наработки на отказ составляет 1 миллион часов, гарантийный срок — 5 лет.

 

6. Интеллектуальный сервер хранения данных Sun StorEdge A7000

 

Sun StorEdge A7000 представляет собой интеллектуальный сервер хранения, решающий важнейшую задачу разделения данных между разными компьютерными платформами. Разделение данных, в отличие от разделения накопителей, означает не только возможность совместного использования дисков и/или лент, но и способность интерпретировать данные, сгенерированные на других платформах.

 

Разделение данных является ключом к их централизации, оно помогает бороться с размножением версий разной степени актуальности, с ослаблением безопасности при экспорте/импорте данных. Коротко говоря, разделение позволяет экономически целесообразным образом сохранять контроль над данными.

 

Особенно остро задача разделения данных встает на границе мира мэйнфреймов и мира открытых систем (см. Jet Info, 1997, 12-13, “Sun фокусируется на информационных центрах”). Именно эту задачу и позволяет решить Sun StorEdge A7000.

 

6.1. Архитектура сервера хранения данных Sun StorEdge A7000

 

Поскольку Sun StorEdge A7000 должен обслуживать два существенно разных вида интерфейсов — с мэйнфреймами и открытыми системами, этот сервер хранения данных представляет собой полноценный компьютер, а не просто дисковый массив. Более того, Sun StorEdge A7000 — это целая стойка, в которую установлены две подсистемы, каждая из которых состоит из четырехпроцессорного Unix-компьютера, интерфейсов к секции дисков, интерфейсов к мэйнфреймам и к открытым системам, а также расположенного в оперативной памяти кэша (см. рис. 10). Подсистемы связаны между собой высокоскоростным каналом “память-память”. В обычном режиме одна подсистема обслуживает мэйнфреймы, другая — открытые системы.

 

Рис. 10. Основные компоненты Sun StorEdge A7000 и их расположение в стойке.

 

Аппаратная структура Sun StorEdge A7000 представлена на рис. 11.


Каждая из двух секций дисков способна вместить до 54 носителей емкостью 9.05 Гб каждый. В совокупности это составляет 977 Гб. Путем программного конфигурирования на часть этих дисков отображаются тома IBM, на другую часть — логические диски открытых систем; оставшиеся могут использоваться для повышения готовности как RAID-резерв.


Функционирование Sun StorEdge A7000 в значительной степени опирается на программное моделирование (эмуляцию). Каждый из двух управляющих Unix-компьютеров (каждая из подсистем) имеет как бы две стороны — фронтальную и тыльную; фронтальная обслуживает связи с хостами, тыльная — с накопителями. На фронтальной стороне эмулируются канальные мэйнфреймовые протоколы и протокол системы SCSI (STE — SCSI Target Emulation); на тыльной — протоколы работы с дисковыми томами. Две стороны объединяются посредством кэша.
Описанная логическая структура Sun StorEdge A7000 представлена на рис. 12.

 

 

Рис. 11. Аппаратная структура интеллектуального сервера хранения данных Sun StorEdge A7000.

 

 

Рис. 12. Логическая структура интеллектуального сервера хранения данных Sun StorEdge A7000.

 

 

Рис. 13. DataShare как логическое ядро Sun StorEdge A7000.

 

 

Управляющие Unix-компьютеры осуществляют как прямое, так и “перекрестное” обслуживание, позволяя читать/писать свои и читать “чужие” данные (то есть данные, записанные на другой платформе). Необходимые преобразования данных для “чужой” платформы выполняет программная система DataShare, являющаяся логическим ядром Sun StorEdge A7000 (рис. 13).
 
Таким образом, в Sun StorEdge A7000 реализовано подлинное разделение данных, исключающее необходимость в их дублировании. Доступ к “чужим” данным выполняется прозрачным образом, не требующим внесения каких-либо изменений в приложения. Например, любая из сторон (мэйнфреймы или компьютеры с открытой архитектурой) может взять на себя заботы о резервном копировании всех данных (своих и чужих).
 
6.2. Функционирование Sun StorEdge A7000
 
Рассмотрим, как Sun StorEdge A7000 обрабатывает запросы хостов на ввод/вывод. Эти запросы поступают на фронтальную сторону подсистем по каналам мэйнфреймов или SCSI. Программное обеспечение фронтальной стороны эмулирует работу соответствующих контроллеров, в результате чего мэйнфреймам кажется, что они обращаются к совокупности IBM-дисков, а открытые системы уверены, что они напрямую общаются со SCSI-устройствами. Обычно на фронтальную сторону работают два из четырех процессоров каждой подсистемы. Выполняющиеся на них процессы выбирают из каналов запросы на ввод/вывод и удовлетворяют их из кэша. В частности, записываемая информация сначала поступает только в кэш; реальная запись на диск производится позднее.
 
Если при запросе на чтение нужных в данных в кэше не оказалось, этот запрос откладывается до завершения реального чтения с дисков и передачи результата в кэш; выборка запросов из каналов и их обработка в это время, разумеется, продолжается.
 
По каналам мэйнфреймов могут передаваться не только запросы на чтение/запись, но и команды позиционирования головок накопителей и целые канальные программы. Не все запросы приводят к реальным действиям, однако Sun StorEdge A7000 обладает достаточным интеллектом, чтобы по канальным командам предвосхитить вероятные последующие действия и выполнить упреждающее чтение или накопить данные для последовательной записи.
 
Процессоры, не занятые обработкой канальных запросов, выполняют легковесные процессы (потоки), обслуживающие реальный
ввод/вывод, преобразование данных и передачу их в кэш (из кэша). Программная архитектура тыльной стороны подсистем будет рассмотрена нами ниже, в разделе, посвященном DataShare.
 
6.3. Устройство кэша в Sun StorEdge A7000
 
Кэш, связывающий между собой фронтальную и тыльную стороны каждой подсистемы, а также, через Memory Channel, обеспечивающий связь подсистем, играет в Sun StorEdge A7000 центральную роль. Кэш каждой подсистемы состоит из следующих областей (см. рис. 14):
 
  • широковещательная область;
  • кэш данных;
  • стабильная память.
 
Широковещательная область используется для хранения информации о состоянии подсистем и для обмена этой информацией по каналу “память-память” (Memory Channel). В информации о состоянии отражается ход обслуживания запросов хостов. В частности, в широковещательной области хранится список еще не записанных блоков данных (они называются также “грязными” блоками). Наличие подобной, постоянно обновляемой информации позволяет в случае плановой или внеплановой остановки одной подсистемы продолжить выполнение ее функций на другой подсистеме.
 
Кэш данных, свой для каждой подсистемы, имеет страничную (блочную) организацию.
 
Рис. 14. Логическая структура кэша Sun StorEdge A7000.
 
Обычно размер блока выбирают равным 4 Кб. Когда пространство кэша данных оказывается исчерпанным, утилизуется “самая забытая” (дольше всего не использовавшаяся) страница.
 
Область стабильной памяти хранит копии блоков, которые должна записать, но еще не записала другая подсистема. Когда запись действительно завершается, соответствующие блоки стабильной памяти освобождаются. Подобное “выборочное зеркалирование” более эффективно, чем полное копирование всего кэша данных. Размер области стабильной памяти может конфигурироваться в зависимости от ожидаемого соотношения запросов на чтение и запись.
 
С аппаратной точки зрения кэш разбивается на пары плат, связанных между собой высокоскоростной параллельной шиной Memory Channel (рис. 15). На каждой плате размещается по 512 Мб памяти с автоматическим обнаружением и исправлением ошибок. Всего пар может быть не более четырех. Это значит, что совокупный размер кэша в Sun StorEdge A7000 лежит в пределах от 1 Гб до 4 Гб.
 
Передача по каналу Memory Channel может производиться двумя способами. Часть областей кэша может быть открыта для пассивного зеркалирования, автоматически переписывающего данные в “парные” блоки при каждой записи. Так отображается информация о состоянии подсистем. Кроме того, программное обеспечение может явно специфицировать передачу данных. Так обновляются блоки стабильной памяти. Пиковая пропускная способность шины Memory Channel при блочной передаче составляет 140 Мб/с.
 
В рамках Sun StorEdge A7000 канал Memory Channel связывает пары плат памяти, однако его архитектура позволяет подключать к шине до 9 плат памяти. Это значит, что в принципе имеется возможность построения на основе Memory Channel развитых кластерных конфигураций.
 
6.4. Программная система StorEdge DataShare
 
StorEdge DataShare — это программная система, архитектурно расположенная между подсистемой кэша и образами логических дисков и позволяющая осуществлять чтение данных, записанных на другой компьютерной платформе.
 
Рис. 15. Архитектура канала Memory Channel.

 

 

Сама система DataShare состоит из трех уровней (см. рис. 16):

 

  • функции доступа к данным;
  • функции обработки и преобразования данных;
  • функции представления данных.

 

Функции доступа к данным интерпретируют структуру эмулируемых томов (дисков IBM или SCSI-дисков) и поставляют данные вышележащим уровням.

 

Функции обработки и преобразования данных осуществляют символьные преобразования (например, перекодировку из EBCDIC в ASCII или иную трансляцию) или изменение формата хранимых записей (например, вставку переводов строк в качестве разделителей). Преобразования можно связывать в цепочки по аналогии с конвейерами в ОС Unix. Цепочки ассоциируются с логическими томами. С одним томом может быть ассоциировано несколько цепочек преобразований; каждая такая ассоциация с точки зрения хоста является отдельным томом (или файловой системой).

 

Функции представления позволяют оформить “чужие” данные в виде понятной логической структуры. Для мэйнфреймов данные представляются в виде дисков со структурой записей CKD (Count, Key, Data — длина записи, ключ записи, собственно данные). Для открытых систем тома мэйнфреймов представляются в виде файловой системы в стандарте ISO 9660 (каждому набору данных соответствует отдельный файл).

 

Рис. 16. Архитектура программной системы StorEdge DataShare.

 

Рис. 17. Пример доступа к данным мэйнфреймов по запросу открытых систем.

 

Соответствующим образом обработанные и представленные данные попадают в кэш, а оттуда передаются запросившим их хостам. Пример доступа к данным мэйнфреймов по запросу открытых систем представлен на рис. 17. Обратим внимание на то, что открытые системы могут читать как “сырые”, так и преобразованные данные (в примере — перекодированные из EBCDIC в ASCII).

 

На наш взгляд, StorEdge DataShare является образцом продуманной уровневой архитектуры, позволяющей сочетать гибкость и высокую эффективность. С одной стороны, можно выбирать цепочки преобразований, максимально упрощающие работу приложений. С другой стороны, никакие преобразования не навязываются, а передача данных между уровнями производится через память, что, в сочетании с мощью управляющих компьютеров, гарантирует быстрый доступ к данным.

 

6.5. Надежность, готовность и обслуживаемость Sun StorEdge A7000

 

Поскольку интеллектуальный сервер хранения данных обслуживает как открытые системы, так и мэйнфреймы, он является критически важным компонентом корпоративных информационных систем, к которому предъявляются повышенные требования по доступности. Для выполнения этих требований в Sun StorEdge A7000 изначально заложены механизмы, гарантирующие надежность, готовность и обслуживаемость.

 

Надежность работы, помимо традиционно высокого качества продуктов компании Sun Microsystems, обеспечивается встроенными источниками бесперебойного питания, а также программными системами, следящими за исправностью аппаратных компонентов Sun StorEdge A7000 и за состоянием логических томов.

 

Готовность гарантируется прежде всего высоким уровнем избыточности, заложенным в Sun StorEdge A7000. Имеется в виду многопроцессорность управляющих компьютеров, резервирование каналов связи с хостами, поддержка различных RAID-уровней, резервирование других, более мелких, но не менее важных элементов.

 

Важнейшим средством обеспечения высокой готовности является двухмашинная организация сервера Sun StorEdge A7000. Как было указано в предыдущем разделе, каждая подсистема хранит информацию о состоянии “напарника”. Если по каким-либо причинам (плановая профилактика, обновление программного обеспечения или авария) одна подсистема перестает работать, второй управляющий компьютер в состоянии завершить все открытые транзакции и затем взять на себя двойную нагрузку.

 

В обычном режиме каждая подсистема обслуживает свой набор дисков. Благодаря применению SCSI-расширителей при необходимости управляющий компьютер может получить доступ ко всем дискам, сохраняя тем самым полноту функциональности.

 

Очень красивым логическим дополнением технологии Memory Channel являются средства удаленного зеркалирования, получившие название RDC (Remote Dual Copy). Канал Memory Channel может быть расширен последовательным соединением для передачи данных по оптоволокну в пределах группы зданий. Эта передача осуществляется в реальном времени на другой сервер Sun StorEdge A7000 без участия каких-либо хостов, минуя каналы локальной сети. В результате применение механизма RDC не связано с затратой внешних (по отношению к Sun StorEdge A7000) ресурсов и почти не сказывается на эффективности работы самих серверов хранения данных (время записи возрастает всего на 5%). На ближайшее будущее запланирована реализация удаленного зеркалирования на основе ATM. Это позволит перемещать данные на неограниченные расстояния, защищаясь от крупных катаклизмов.

 

Обслуживаемость Sun StorEdge A7000 обеспечивается за счет возможности горячей замены компонентов и динамического переконфигурирования. В сочетании с механизмами высокой готовности средства обслуживаемости гарантируют сколь угодно длительный период непрерывной доступности данных, хранящихся на интеллектуальном сервере Sun StorEdge A7000.

 

7. Другие модели дисковых массивов семейства Sun StorEdge

 

7.1. Sun StorEdge A3000

 

Sun StorEdge A3000 — это дисковый массив, основанный на известной модели Sun RSM 2000. Он призван заменить массивы SPARCstorage Array 2xx.

 

Характерная черта Sun StorEdge A3000 — интеллектуальность плат RAID-контроллера (их две). На каждой плате установлен процессор i486/100 МГц и соответствующий набор микросхем (см. рис. 18), позволяющий освободить хост от вычислений, связанных с поддержкой механизмов RAID. Кроме того, на плате размещается 16 Мб памяти для процессора и 64 Мб — для дискового кэша. Подобные характеристики позволили Sun StorEdge A3000 установить ряд рекордов производительности (например, по TPC-D) совместно с серверами Ultra Enterprise.

 

Рис. 18. Устройство контроллера Sun StorEdge A3000.

 

 

Рис. 19. Общая схема дискового массива Sun StorEdge A3000.

Общая схема дискового массива Sun StorEdge A3000 приведена на рис. 19. Накопители распределены по пяти секциям, максимальное число накопителей в секции — семь, что при использовании дисков емкостью 9.05 Гб дает теоретический суммарный объем почти 320 Гб. На практике этот объем несколько меньше. Обычно Sun StorEdge A3000 функционирует в режиме RAID-5, так что часть дисков хранит избыточные биты, а еще часть может использоваться как резерв.

 

Следует обратить внимание на следующие моменты.

 

  • Связь контроллеров с хостом осуществляется по двум каналам Ultra SCSI, что дает теоретическую пропускную способность в 80 Мб/с, а практическую — 60 Мб/с.
  • Контроллеры связаны с каждой секцией накопителей каналом F/W SCSI (20 Мб/с).
  • Все важные элементы Sun StorEdge A3000 зарезервированы, обеспечена их замена в горячем режиме.
  • Каждая секция накопителей укомплектована картой SEN (SCSI Environmental Sense), позволяющей контролировать состояние дисков и окружающей среды. Каждые 10 секунд контроллер опрашивает SEN-карты, которые посылают ответ по каналам SCSI.
  • Батарейки, имеющиеся на платах контроллеров, способны обеспечить сохранение содержимого кэша как минимум 3 дня — для ремонта срок вполне достаточный.
  • Драйвер RDAC (Redundant Dual Active Controller), располагающийся в ядре ОС Solaris над SCSI-драйвером, позволяет автоматически переключиться с отказавшего контроллера на исправный.

 

Рис. 20. Включение дискового массива Sun StorEdge A3000 в кластерную конфигурацию.

 

 

К одному серверу Ultra Enterprise можно подключить несколько дисковых массивов Sun StorEdge A3000 (от 2 для Sun Enterprise 2 до 52 для Sun Enterprise 10000). Особо отметим, что при подключении к Sun Enterprise 10000 поддерживается “переброска” массива из одного домена в другой без перезагрузки доменов.

 

Дисковый массив Sun StorEdge A3000 допускает подключение к хостам несколькими способами, в том числе в режиме разделения контроллеров (рис. 20). В этом смысле он готов к использованию в кластерных конфигурациях.

 

7.2. Sun StorEdge A1000

 

Sun StorEdge A1000 можно рассматривать как младшую модель Sun StorEdge A3000, предназначенную для обслуживания рабочих групп или настольных систем. У этих дисковых массивов много общего, поэтому в данном разделе мы остановимся только на различиях.

 

Sun StorEdge A1000 выпускается в настольном исполнении. В корпус можно установить до 12 накопителей емкостью по 4.2 Гб, что дает суммарный объем около 50 Гб. Если смонтировать несколько Sun StorEdge A1000 в стойку, то общая емкость способна составить около 450 Гб. Это свидетельствует о высокой масштабируемости данного дискового массива.

 

На аппаратном RAID-контроллере установлен процессор Pentium/100 МГц и оперативная память от 8 до 16 Мб. При записи данные помещаются в кэш объемом 24-80 Мб.

 

Как и другие дисковые массивы семейства Sun StorEdge, модель A1000 характеризуется отличной обслуживаемостью. Среднее время восстановления составляет не более 30 минут, включая обнаружение неисправности и перезагрузку системы.

 

8. Ленточные устройства

 

Характерная черта решений, предлагаемых компанией Sun Microsystems, — их комплексность. Применительно к серверам хранения это означает, что обеспечивается не только оперативный доступ к корпоративным данным, но и резервное копирование, архивирование, а также иерархическая организация долговременной памяти.

 

Резервное копирование и архивирование может обслуживаться целым рядом устройств. Мы рассмотрим два из них — Sun StorEdge L1800 и L3500. Грубо можно считать, что L3500 по количественным характеристика превосходит L1800 вдвое; в архитектурном плане эти устройства схожи.

 

Sun StorEdge L1800 и L3500 представляют собой ленточные библиотеки для цифровых лент с линейной записью (DLT). Sun StorEdge L1800 содержит до четырех приводов DLT7000, позволяющих записать на один картридж 35 Гб данных в режиме без сжатия и 70 Гб при двукратном сжатии. Модель L3500 допускает установку до 7 приводов. В L1800 имеется 48 ячеек для хранения картриджей, в L3500 — 96. Это значит, что суммарная емкость библиотеки составляет примерно 1.7 Тб для модели L1800 и 3.4 Тб для L3500 без учета возможности сжатия.

 

Sun StorEdge L1800 и L3500 предназначены для выполнения резервного копирования в автоматическом режиме, без участия оператора. Смена картриджей производится манипулятором, способным читать штрих-коды для контроля носителей. Допускается и ручная установка, для чего предусмотрено еще 4 ячейки. Так что, строго говоря, к приведенным выше объемам следует добавить еще 140 Гб.

 

Нередко в иерархии долговременной памяти ленточные устройства оказываются узким местом, однако с приводом DLT7000 такая

опасность едва ли реальна. Его пропускная способность составляет 7 Мб/с (примерно 25 Гб/ч), что сопоставимо со скоростью Fast Ethernet.

 

Следует учитывать также возможность параллельной работы нескольких приводов с линейным ростом суммарной пропускной способности.

 

Sun StorEdge L1800 и L3500 подключаются к хостам через SCSI-адаптеры. На одной шине SCSI может располагаться не более двух приводов.

 

Для более мощных конфигураций требуется несколько адаптеров. (Отметим, что разные адаптеры могут принадлежать разным хостам. К Sun StorEdge L1800 можно подключить два сервера Ultra Enterprise, а к Sun StorEdge L3500 — четыре.) Манипулятор также является SCSI-устройством, способным разделять шину с одним или двумя приводами.

 

Табл. 2. Средняя наработка на отказ компонентов ленточных библиотек.

 

 

Sun StorEdge L1800 и L3500 обладают весьма высокими показателями надежности. В табл. 2 сведены данные о средней наработке на отказ для различных компонентов ленточных библиотек.

 

Следует отметить, что надежной работе Sun StorEdge L1800 и L3500 способствует сама технология цифровой линейной записи, выбранная компанией Sun Microsystems. Малое число движущихся частей, неподвижные головки делают линейные приводы более надежными по сравнению с приводами с вращающимися головками (Helical Scan) при сопоставимых емкости картриждей и времени доступа.

 

9. Программное обеспечение сети хранения данных

 

Программные продукты, обслуживающее сеть хранения данных, можно подразделить на три категории:

 

  • средства резервирования данных (Sun StorEdge Enterprise NetBackup, Solstice Backup, Sun StorEdge Remote Dual Copy);
  • средства управления данными (Sun StorEdge Volume Manager, Solstice DiskSuite, Sun StorEdge Enterprise HSM, Sun StorEdge Lib-MON);
  • средства разделения данных (Sun StorEdge DataShare).

 

Ближайшая цель компании состоит в интеграции перечисленных продуктов в рамках единой среды, построенной на основе Java-технологии. Графическая оболочка этой среды получила название Sun StorEdge Enterprise Storage Manager (ESM). Представляется, что достижение поставленной цели — вопрос чисто технический, не связанный с решением каких-либо принципиальных проблем, так что объявление Sun StorEdge Enterprise Storage Manager не за горами.

 

Ниже мы кратко рассмотрим возможности наиболее интересных компонентов единой программной среды хранения данных.

 

9.1. Sun StorEdge Enterprise NetBackup

 

Sun StorEdge Enterprise NetBackup — это корпоративный инструмент резервного копирования, архивирования и восстановления, способный обслуживать тысячи Unixи ПК-клиентов и множество серверов и предоставляющий администратору единую управляющую консоль.

 

Рис. 21. Программная архитектура Sun StorEdge Volume Manager.

 

 

Основными компонентами Sun StorEdge Enterprise NetBackup являются:

 

  • NetBackup-серверы. В данном контексте под серверами понимаются системы, к которым подключены устройства резервного копирования. Серверы могут группироваться в кластеры с выделением ведущих и ведомых. Ведущие планируют операции резервного копирования и хранят каталоги сохраненных данных. Ведомые серверы работают под управлением ведущих и позволяют разгрузить последние.
  • NetBackup-клиенты. Клиентское программное обеспечение располагается на компьютерах, содержащих сохраняемые данные. Клиенты генерируют потоки данных, если нужно, выполняют их сжатие и направляют на серверы через TCP-сокеты.
  • NetBackup-агенты баз данных. Агенты предназначены для оперативного копирования баз данных. В настоящее время поддерживаются СУБД Oracle, Informix, Sybase. Агенты функционируют на серверах баз данных и взаимодействуют с соответствующими утилитами резервного копирования (Oracle OEBU, Informix ON-Bar, Sybase Backup Server).

 

Менеджер устройств. Он состоит из трех основных подсистем:

 

  • управление манипуляторами;
  • управление накопителями;
  • управление носителями.

 

Единый менеджер устройств используется и в Sun StorEdge Enterprise NetBackup, и в Sun StorEdge Enterprise HSM, что обеспечивает согласованное управление иерархически организованной долговременной памятью.

 

Sun StorEdge Enterprise NetBackup имеет продуманную архитектуру, позволяющую эффективно обслуживать большие корпоративные системы. Однородные сущности, такие как носители или клиентские системы, могут группироваться в пулы или классы, что облегчает их централизованное администрирование. Благодаря использованию агентов удается успешно справиться с разнородностью клиентов как в смысле компьютерных платформ, так и в смысле способов хранения данных.

 

Разумеется, Sun StorEdge Enterprise NetBackup поддерживает такие возможности, как контроль срока годности данных на носителях (по истечении срока данные могут быть перезаписаны), разграничение доступа к резервным копиям, восстановление данных по инициативе клиента, оперативное слежение за ходом сохранения/восстановления, сбор и анализ регистрационной информации и т.п. Для восстановления служебных баз данных Sun StorEdge Enterprise NetBackup существуют специальные процедуры, применяемые администратором.

 

9.2. Sun StorEdge Volume Manager

 

Sun StorEdge Volume Manager — это средство программного моделирования RAID-уровней 0, 1, 0+1 и 5 по существу на произвольных дисковых накопителях. Начиная с версии 2.5, Sun StorEdge Volume Manager выполняет еще одну очень важную функцию — динамическую поддержку избыточных путей (Dynamic MultiPathing, DMP). Функции DMP позволяют автоматически балансировать нагрузку и нейтрализовывать отказы при наличии избыточных путей к накопителям. Естественно, имеется и графическая оболочка, называемая Visual Administrator (vxva).

 

Sun StorEdge Volume Manager имеет многоуровневую организацию, представленную на рис. 21. На верхнем уровне располагаются утилиты, вызываемые системным администратором для создания логических томов и управления ими. Ниже помещается база данных о томах. Наконец, на нижний уровень вынесен драйвер логических томов. С точки зрения операционной системы драйвер томов располагается в пространстве ядра, над уровнем драйверов физических устройств и под уровнем файловых систем и иных приложений.

 

Драйвер логических томов — это ключевой компонент Sun StorEdge Volume Manager, отрабатывающий запросы на ввод/вывод и на изменение конфигурации моделируемого RAID-массива.

 

Следует отметить высокую динамичность Sun StorEdge Volume Manager. Он позволяет “на ходу” изменять размеры логических томов и расположенных на них файловых систем UFS. Наряду со средствами динамической поддержки избыточных путей (DMP) это способствует повышению готовности логических дисковых массивов.

 

9.3. Некоторые другие программные продукты

 

Sun StorEdge Enterprise HSM поддерживает иерархическую организацию хранения, автоматически перемещая данные с одного носителя на другой на основании заданных администратором правил.

 

Sun StorEdge LibMON служит для администрирования ленточных библиотек с помощью Web-навигатора, поддерживающего Java-аплеты.

 

Solstice SyMON — это средство слежения за различными параметрами работающих систем. Представление о спектре отслеживаемых параметров дает рис. 22, на котором изображен стартовый экран Solstice SyMON. Информация извлекается четырьмя агентами непосредственно из аппаратуры и из системного журнала. Отметим, что Solstice SyMON версии 1.5 поддерживает дисковый массив Sun StorEdge A5000; поддержку Sun StorEdge А3000 и A1000 предполагается добавить позднее.

 

В целом программные продукты семейства Sun StorEdge образуют достаточно полный многофункциональный комплекс, способный обслуживать большие корпоративные системы. Реализация управляющего ядра Sun StorEdge Enterprise Storage Manager (ESM) на Java-платформе сделает семейство по-настоящему интегрированным, снабдит его мобильным централизованным управлением всеми аспектами хранения данных.

 

Рис. 22. Графическая оболочка системы Solstice SyMON.

 

 

10. Заключение

 

Концепция интеллектуальной сети хранения данных, предложенная компанией Sun Microsystems, представляется весьма актуальной. На наш взгляд, в ней найден верный баланс между революционностью и эволюционностью, позволяющий сохранить инвестиции и, в то же время, двигаться по пути решения все более обостряющейся проблемы хранения корпоративных данных.

 

Концепция находится в стадии реализации. Многие ключевые элементы уже существуют. Это прежде всего технология Fibre Channel, дисковые

 

массивы Sun StorEdge A5000 и A3000, интеллектуальный сервер хранения данных Sun StorEdge A7000 и ассоциированные с ним технологии, семейство программных продуктов. Некоторые важные элементы, такие как Sun StorEdge Enterprise Storage Manager, еще предстоит реализовать. Тем не менее, уже сейчас семейство Sun StorEdge обладает полнотой, достаточной для практического использования самыми требовательными заказчиками. Очевидна и перспективность идей, положенных в основу концепции интеллектуальной сети хранения и защищающих решения Sun Microsystems от морального старения.

Уведомления об обновлении тем – в вашей почте

Методы построения систем хранения данных

Отсутствие доступа к данным равноценно отсутствию данных!   Доступ к данным невозможен как в случае выхода из строя каналов (доступа) или вычислительных средств, так и в случае отсутствия необходимой производительности для выполнения ...

Виртуализация – свобода выбора, гибкость и мощные средства управления

О теме виртуализации все чаще можно услышать в различных сферах ИТ-индустрии, поскольку в данный момент она переживает довольно бурный рост и развитие, особенно в направлении серверных ресурсов.

Identity Management: взгляд Sun Microsystems

Развитие сетевого сообщества подчиняется тем же законам, что и развитие общества, за одним исключением: все процессы идут во много раз быстрее

Сети в облаках

Глубина и темпы проникновения ИТ в личную и корпоративную жизнь сейчас уже никого не удивляют. В наиболее развитых странах революцию в этой области можно считать состоявшейся: объемы данных в информационных системах вышли на экспоненциальный рост, который даже опережает темпы, предсказываемые законом Мура

Middleware: модель сервисов распределенной системы

Вычислительные средства больших компаний превращаются в обычные службы, аналогичные энергетическим и телекоммуникационным (например, телефонным) службам. С точки зрения информационной службы, любой сотрудник организации, работающий с информацией, ...

Открытые сетевые решения 1990-х годов

Я работаю в должности директора по информационным технологиям (ИТ) компании Sun Microsystems около 5 лет. В Соединенных Штатах это считается очень большим сроком, поскольку руководителям отделов ИТ приходится сталкиваться с проблемами весьма ...

Маленькая «серебряная пуля»

Данные – новая валюта бизнеса. Пожалуй, многие согласятся с таким утверждением

Unix Expo. The Open Systems & Networking Show. Специальный выпуск

Современные приложения становятся все сложнее, а их возможности — богаче. Современные пользователи этих приложений демонстрируют все большую искушенность и возросшую техническую подготовку. Эти тенденции настойчиво раздвигают границы информационных ...

Что делать, если СХД болит

Сказать, что сегодня объем корпоративных данных растет, значит, не сказать ничего.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня