ИТ-портал компании «Инфосистемы Джет»

Универсальный доступ к СХД

Универсальный доступ к СХД

Современные информационные технологии развиваются не один десяток лет, и во многих областях сложились свои подходы к организации доступа к данным. Первым по популярности, безусловно, является блочный доступ. С ним вы впервые сталкиваетесь в домашних компьютерах и ноутбуках, используя ставшие уже привычными жесткие диски. В небольших компаниях ИТ-персонал использует установленные в серверы RAID-контроллеры с дисками, которые тоже применяют блочный доступ к данным. И наконец, к системам с блочным доступом относится множество СХД, использующих протоколы Fibre Channel (FC), iSCSI и FCoE.

Какие же приложения получают максимальный эффект от блочного доступа к данным? В первую очередь те, которые требуют высокой производительности – базы данных (БД), почтовые системы. БД зачастую являются частью более крупных решений, таких как системы биллинга, банковского процессинга, документооборота, ERP и др. Системы биллинга и банковского процессинга особо чувствительны к производительности СХД. Ведь когда невозможно принять информацию о совершенном звонке или банковской транзакции, компания не может выставить счет за совершенный за рубеж звонок или удержать проценты от банковского перевода. А это приводит к прямым убыткам.

Файловый доступ не уступает по популярности блочному и очень широко используется практически в каждой компании. Домашние папки пользователей, сетевые хранилища документов, файлообменные ресурсы – вот далеко не полный перечень его применения. Он также зачастую используется для высокопроизводительных вычислений, таких как геофизические, научные расчеты на высокопроизводительных кластерах, обработка медиаконтента. Причина его применения в столь ответственных областях – возможность одновременного доступа к общим данным с сотен и тысяч хостов.

Представьте себе геофизическую компанию, которой нужно провести первичную обработку сейсмических данных с площади в несколько квадратных километров. Еще 5–7 лет назад «сырые» сейсмические данные в этом случае потребовали бы для своего хранения и обработки порядка 10 ТБ дискового пространства. По мере увеличения производительности современных вычислительных платформ и СХД объёмы «сырых» данных выросли в 5–10 раз. Это позволило увеличить точность геофизического анализа, но в то же время повысило требования к вычислительной мощности средств обработки. Современные вычислительные кластеры крупных геофизических компаний насчитывают от нескольких сотен до нескольких тысяч узлов в каждом из них. И файловый доступ остаётся единственным высокопроизводительным и экономически эффективным способом параллельного доступа к большим объёмам данных.

Рис. 1. Результаты тестирования HUS-VM с СУБД Oracle

На протяжении последних 5 лет набирают популярность облачные решения и решения по серверной и десктопной виртуализации. Первое время они использовали блочный доступ, и их масштабирование было ограничено. Причина состояла в том, что для их работы были нужны общие дисковые ресурсы, а производительность одновременного доступа к ресурсам по блочным протоколам снижается при масштабировании решения, естественно, требующем роста числа хостов. Последние тенденции, нивелирующие эту проблему, – использование файлового доступа для предоставления общих дисковых ресурсов. Одновременный доступ со стороны множества гипервизоров позволяет строить по-настоящему большие cloud-решения и решения по виртуализации.

Два в одном

Давайте теперь рассмотрим нашу систему хранения данных HUS-VM (Hitachi Unified Storage Virtual Machine) и те её особенности, которые позволяют использовать её для блочного и файлового хранения данных. HUS-VM позиционируется как платформа начального уровня в линейке корпоративных СХД. Она является новейшим продуктом среди систем хранения Hitachi Data Systems, совмещая в себе мощь высокопроизводительной платформы Virtual Storage Platform с масштабируемостью и унифицированным доступом к данным систем среднего класса Hitachi Unified. В HUS-VM используется архитектура и микрокод от СХД VSP, что позволяет ей решать самый широкий круг задач в среде среднего и крупного бизнеса. Возможности платформы позволяют создать на ее основе универсальную систему хранения для практически любых типов данных.

Для блочного доступа HUS-VM поддерживает протоколы Fibre Channel и iSCSI, а использование новейших flash-дисков собственного производства позволяет строить высокопроизводительные решения для самых требовательных приложений. В качестве примера здесь можно привести независимое тестирование системы HUS-VM с СУБД Oracle. Наша система хранения смогла продемонстрировать показатели производительности на случайных операциях ввода/вывода, равные 806 000 IOPS при времени отклика 0,84 мс. Это очень высокий результат, который позволяет рекомендовать HUS-VM для решения широчайшего спектра задач.

Для доступа по файловым протоколам CIFS и NFS совместно с блочным контроллером HUS-VM используются файловые модули Hitachi NAS (HNAS). Кластер файловых модулей масштабируется до 8 нод и позволяет строить решения с высокими требованиями к масштабируемости. Отличительной особенностью нашей файловой платформы является архитектура файловых модулей. Они созданы с использованием гибридной архитектуры: платформа х86 используется совместно со специализированными процессорами (FPGA) для ускорения и распараллеливания части операций сетевого, блочного и файлового ввода/вывода. Этот подход на рынке не уникален. Он используется, например, в высокопроизводительных сетевых адаптерах с функционалом TCP Offload Engine (TOE), когда часть операций по обработке служебного трафика TCP/IP перекладывается на процессор сетевой карты. Каждый FPGA-процессор, установленный в файловом модуле, имеет множество параллельных вычислительных блоков, позволяющих обрабатывать большое число команд одновременно. При этом центральный процессор освобождается от рутинных операций и берет на себя обработку непосредственно данных CIFS/NFS, реализацию файлового функционала и др. Таким образом, архитектура HNAS не имеет узких мест, присущих архитектуре с использованием многоядерных процессоров, которая даже с учетом Hyper Threading может обрабатывать параллельно не более 24 команд (E5 12 core).

Рис. 2. Результаты теста производительности

Для подтверждения высоких показателей производительности мы приводим результаты популярных тестов – SPECsfs2008_nfs.v3. Мы показали не только высокие показатели по производительности, но и отличный результат по времени выполнения операции ввода/вывода (latency), равный 0,59 мс.


Резюмируя вышесказанное, можно сказать, что HUS-VM хорошо подходит для решения большинства задач в сегменте среднего и корпоративного уровня хранения данных. Система предоставляет унифицированный доступ к данным по блочным и файловым протоколам, позволяя строить высокопроизводительные и масштабируемые решения. За свои характеристики HUS-VM уже получила признание большого числа компаний как одна из лучших систем в своем классе. 

Вернуться к списку статей
Оставьте комментарий
Мы не публикуем комментарии: не содержащие полезной информации или слишком краткие; написанные ПРОПИСНЫМИ буквами; содержащие ненормативную лексику или оскорбления.
О журнале

Журнал Jet Info регулярно издается с 1995 года.

Узнать больше »
Подписаться на Jet Info

Хотите узнавать о новых номерах.

Заполните форму »
Контакты

Тел: +7 (495) 411-76-01
Email: journal@jet.su