Какие же приложения получают максимальный эффект от блочного доступа к данным? В первую очередь те, которые требуют высокой производительности – базы данных (БД), почтовые системы. БД зачастую являются частью более крупных решений, таких как системы биллинга, банковского процессинга, документооборота, ERP и др. Системы биллинга и банковского процессинга особо чувствительны к производительности СХД. Ведь когда невозможно принять информацию о совершенном звонке или банковской транзакции, компания не может выставить счет за совершенный за рубеж звонок или удержать проценты от банковского перевода. А это приводит к прямым убыткам.
Файловый доступ не уступает по популярности блочному и очень широко используется практически в каждой компании. Домашние папки пользователей, сетевые хранилища документов, файлообменные ресурсы – вот далеко не полный перечень его применения. Он также зачастую используется для высокопроизводительных вычислений, таких как геофизические, научные расчеты на высокопроизводительных кластерах, обработка медиаконтента. Причина его применения в столь ответственных областях – возможность одновременного доступа к общим данным с сотен и тысяч хостов.
Представьте себе геофизическую компанию, которой нужно провести первичную обработку сейсмических данных с площади в несколько квадратных километров. Еще 5–7 лет назад «сырые» сейсмические данные в этом случае потребовали бы для своего хранения и обработки порядка 10 ТБ дискового пространства. По мере увеличения производительности современных вычислительных платформ и СХД объёмы «сырых» данных выросли в 5–10 раз. Это позволило увеличить точность геофизического анализа, но в то же время повысило требования к вычислительной мощности средств обработки. Современные вычислительные кластеры крупных геофизических компаний насчитывают от нескольких сотен до нескольких тысяч узлов в каждом из них. И файловый доступ остаётся единственным высокопроизводительным и экономически эффективным способом параллельного доступа к большим объёмам данных.
Рис. 1. Результаты тестирования HUS-VM с СУБД Oracle
На протяжении последних 5 лет набирают популярность облачные решения и решения по серверной и десктопной виртуализации. Первое время они использовали блочный доступ, и их масштабирование было ограничено. Причина состояла в том, что для их работы были нужны общие дисковые ресурсы, а производительность одновременного доступа к ресурсам по блочным протоколам снижается при масштабировании решения, естественно, требующем роста числа хостов. Последние тенденции, нивелирующие эту проблему, – использование файлового доступа для предоставления общих дисковых ресурсов. Одновременный доступ со стороны множества гипервизоров позволяет строить по-настоящему большие cloud-решения и решения по виртуализации.
Два в одном
Давайте теперь рассмотрим нашу систему хранения данных HUS-VM (Hitachi Unified Storage Virtual Machine) и те её особенности, которые позволяют использовать её для блочного и файлового хранения данных. HUS-VM позиционируется как платформа начального уровня в линейке корпоративных СХД. Она является новейшим продуктом среди систем хранения Hitachi Data Systems, совмещая в себе мощь высокопроизводительной платформы Virtual Storage Platform с масштабируемостью и унифицированным доступом к данным систем среднего класса Hitachi Unified. В HUS-VM используется архитектура и микрокод от СХД VSP, что позволяет ей решать самый широкий круг задач в среде среднего и крупного бизнеса. Возможности платформы позволяют создать на ее основе универсальную систему хранения для практически любых типов данных.
Для блочного доступа HUS-VM поддерживает протоколы Fibre Channel и iSCSI, а использование новейших flash-дисков собственного производства позволяет строить высокопроизводительные решения для самых требовательных приложений. В качестве примера здесь можно привести независимое тестирование системы HUS-VM с СУБД Oracle. Наша система хранения смогла продемонстрировать показатели производительности на случайных операциях ввода/вывода, равные 806 000 IOPS при времени отклика 0,84 мс. Это очень высокий результат, который позволяет рекомендовать HUS-VM для решения широчайшего спектра задач.
Для доступа по файловым протоколам CIFS и NFS совместно с блочным контроллером HUS-VM используются файловые модули Hitachi NAS (HNAS). Кластер файловых модулей масштабируется до 8 нод и позволяет строить решения с высокими требованиями к масштабируемости. Отличительной особенностью нашей файловой платформы является архитектура файловых модулей. Они созданы с использованием гибридной архитектуры: платформа х86 используется совместно со специализированными процессорами (FPGA) для ускорения и распараллеливания части операций сетевого, блочного и файлового ввода/вывода. Этот подход на рынке не уникален. Он используется, например, в высокопроизводительных сетевых адаптерах с функционалом TCP Offload Engine (TOE), когда часть операций по обработке служебного трафика TCP/IP перекладывается на процессор сетевой карты. Каждый FPGA-процессор, установленный в файловом модуле, имеет множество параллельных вычислительных блоков, позволяющих обрабатывать большое число команд одновременно. При этом центральный процессор освобождается от рутинных операций и берет на себя обработку непосредственно данных CIFS/NFS, реализацию файлового функционала и др. Таким образом, архитектура HNAS не имеет узких мест, присущих архитектуре с использованием многоядерных процессоров, которая даже с учетом Hyper Threading может обрабатывать параллельно не более 24 команд (E5 12 core).
Рис. 2. Результаты теста производительности
Для подтверждения высоких показателей производительности мы приводим результаты популярных тестов – SPECsfs2008_nfs.v3. Мы показали не только высокие показатели по производительности, но и отличный результат по времени выполнения операции ввода/вывода (latency), равный 0,59 мс.
Резюмируя вышесказанное, можно сказать, что HUS-VM хорошо подходит для решения большинства задач в сегменте среднего и корпоративного уровня хранения данных. Система предоставляет унифицированный доступ к данным по блочным и файловым протоколам, позволяя строить высокопроизводительные и масштабируемые решения. За свои характеристики HUS-VM уже получила признание большого числа компаний как одна из лучших систем в своем классе.