ИТ-портал компании «Инфосистемы Джет»

Пора ли переходить на All-Flash СХД?

Пора ли переходить на All-Flash СХД?

В последнее время не проходит и месяца без появления отраслевых новостей, касающихся новых решений для хранения данных. Гонка за бюджеты заказчиков всё чаще разворачивается в плоскости противостояния привычных дисковых массивов и решений, построенных на flash-накопителях. Сегодня большинство производителей выпустили, как минимум, по одной линейке All-Flash массивов (AF). В этой статье мы рассматриваем варианты, когда AF-массивы действительно эффективны, а также случаи, когда им еще нужно время для улучшения своих характеристик. Но сначала скажем несколько слов о стоимости этих решений.

Экономика All-Flash

Снижение стоимости flash-накопителей в последние несколько лет привело к естественному росту доли SSD в сегменте хранения данных. В большинстве современных систем хранения flash присутствует в том или ином виде:

  • для кэширования наиболее часто используемых данных (примеры таких решений – FAST Cache на массивах EMC VNX, FlashPool или FlashCache на массивах NetApp FAS);

  • для хранения наиболее часто используемых данных в гибридном пуле, включающем SSD- и HDD-накопители (tiering на массивах Hitachi, HP);

  • для наиболее требовательных к производительности задач в виде выделенного пула из SSD-накопителей.

При этом стоимость «сырой емкости» ($/GB) flash-накопителей сегодня в несколько раз превышает стоимость HDD, поэтому повсеместного перехода на All-Flash еще не произошло. Однако производители flash-памяти и СХД усиленно работают над ее снижением. Серьёзным шагом в этом направлении должно стать применение новейших flash-накопителей, произведенных по технологии 3D NAND (множество слоев flash-памяти, расположенных один над другим, как в слоёном пироге). Так, компания Samsung, являющаяся лидером по объему производства flash-накопителей, недавно заявила о выпуске SSD объемом 15 ТБ в форм-факторе 2.5". Такая плотность возможна благодаря применению сразу нескольких технологий – 3D NAND и TLC (3-битные ячейки). Стоит отметить, что по технологии 3D NAND может производиться flash-память как MLC- (2-битные ячейки), так и TLC-типа. Несмотря на относительную новизну накопителей 3D NAND TLC, они уже нашли применение в следующих All-Flash массивах: EMC Unity F, NetApp AFF, NetApp SolidFire, Dell Compellent, HP 3PAR, Pure Storage FlashArray//m.

Intel и Micron также заявили о выпуске flash-накопителей 3D NAND, Toshiba совместно с SanDisk пока еще разрабатывают свой вариант технологии. Мы ожидаем, что повышение конкуренции и насыщение рынка приведет к снижению стоимости flash-накопителей большого объема.

Поскольку при производстве 3D NAND чипов flash-памяти используется более «толстая» технология производства (20–40 нм вместо 16 нм для однослойных чипов), продолжительность жизни ячеек памяти увеличивается. Это практически устраняет проблему «износа» flash-накопителя даже в самых нагруженных системах.

О 2D flash-памяти

Если в используемых приложениях преобладают операции записи, правильнее хранить данные на eMLC-накопителях. Когда требуется большая емкость и преобладают операции чтения, можно использовать более экономичные TLC-накопители, т.к. чтение данных не снижает ресурс ячеек flash. В действительности «страшилки» про низкий ресурс flash-накопителей для большинства заказчиков не актуальны. Современные eMLC SSD способны выдерживать до 10 полных циклов перезаписи в день на протяжении всего гарантийного срока. При этом многие производители СХД предлагают бесплатную замену накопителей, находящихся на гарантии или расширенной поддержке, даже в случае их полного износа и независимо от типа модулей.

Что же сегодня предпринимают производители для снижения стоимости своих решений? Многие All-Flash массивы предполагают использование технологий экономии места (дедупликация, «тонкие» клоны, компрессия) благодаря применению современных высокопроизводительных процессоров. И все же периодически приходится идти на компромисс при использовании компрессии и/или дедупликации из-за снижения итоговой производительности массива. Так что при выборе AF-массива необходимо определиться, действительно ли вам нужна скорость 200,000+ IOPS, или будет достаточно 50,000–100,000 IOPS, но с возможностью хранить в 2–4 раза больше данных.

Технологиям дедупликации уже не один год, однако их применение обычно ограничивалось «холодными данными» или резервными копиями. Причиной была низкая производительность механических дисков при случайном доступе к данным. Новое развитие дедупликация получила как раз с появлением flash-накопителей. Однако до сих пор не во всех AF-массивах дедупликация реализована или осуществляется в онлайн-режиме, когда блоки проверяются на уникальность в оперативной памяти еще до записи данных на flash.

Кто есть кто на рынке

Как уже было сказано, в All-Flash «играют» все основные производители дисковых массивов – EMC, NetApp, IBM, HP, Hitachi, Oracle. Большая часть их решений представляет собой модернизированные дисковые массивы, но есть и несколько очень удачно приобретенных продуктов – All-Flash стартапов. Также на этом поле присутствует ряд компаний-стартапов, занимающих небольшую долю рынка, например Violin Memory. Один из ведущих мировых игроков на рынке All-Flash, который не представлен в России, – Pure Storage – пока не обозначал планов по выходу на российский рынок. Ряд производителей имеет в своем модельном ряду несколько линеек All-Flash массивов, отличающихся по функциональности, производительности и решающих разный спектр задач.

Стоит сказать несколько слов об All-Flash продуктах компании Huawei: в данный момент все массивы производителя могут быть сконфигурированы в варианте All-Flash с SSD-накопителями, по своим основным характеристикам они сопоставимы с уровнем развития решений ведущих мировых производителей. В ближайшее время компания планирует выпустить обновление AF-массива OceanStore Dorado, в котором будут применяться многие актуальные технологии, например, NVMe-накопители и сжатие данных в реальном времени.

All-Flash массивы значительно различаются по способу записи и хранения информации, что сказывается на их «предрасположенности» к использованию для тех или иных задач. Выросшие из стартапов и изначально разрабатываемые именно как flash-массивы EMC XtremIO, Pure Storage FlashArray//m и NetApp SolidFire лучше подходят для большого количества мелких запросов, характерного для сред виртуализации. Они выполняют дедупликацию и компрессию в режиме реального времени. Эти технологии позволяют значительно экономить дисковое пространство и бережнее использовать ресурс ячеек flash-памяти.

Отметим, что дедупликация хорошо работает в случаях использования виртуализации и VDI, а компрессия может обеспечить уменьшение объема, занимаемого базами данных, до 50% (если она или шифрование не используется в самих БД). Чаще всего компрессия выполняется на процессорах контроллеров flash-массивов, но есть и примеры выделения под эти задачи отдельных ресурсов: в массивах IBM FlashSystem для этого используются специализированные PCI-Express модули, а в Hitachi VSP F – контроллеры, встроенные во flash-модули FMD DC2.

Массивы, создававшиеся для аналитики и высоконагруженных баз данных (Hitachi VSP F, IBM FlashSystem, Violin Memory FSP и Oracle FS1), обеспечивают высокую производительность в операциях последовательного доступа.

Направления развития All-Flash

Существует 2 направления позиционирования и развития AF-массивов. Первая категория решений рассчитана на замену многофункциональных гибридных массивов, а вторая призвана обеспечить максимальное быстродействие для некоторых задач. К первой группе, реализующей практически весь функционал гибридных «собратьев», можно отнести: NetApp AFF (блочный/файловый доступ, функционал обычных FAS), Hitachi VSP F (почти весь функционал, кроме Global Active Device), EMC Unity F (функционал гибридных Unity), HP 3PAR All-Flash (функционал гибридных 3PAR), Dell Compellent All-Flash (весь функционал, включая возможность многоуровневого хранения на разных видах SSD-накопителей).

Более специализированные решения для ускорения конкретных задач: EMC XtremIO (виртуализация, VDI, OLTP), IBM FlashSystem и Violin Memory FSP (виртуализация, VDI, базы данных для аналитики и OLTP, антифрод), NetApp EF (базы данных для аналитики и OLTP), Hitachi HFS A (виртуализация, VDI), NetApp SolidFire (Scale-Out для облачных провайдеров).

Подчеркнем, что многофункциональные массивы могут предложить больше сервисов, связанных с хранением и управлением данными, при этом они не всегда уступают по скорости узкоспециализированным решениям.

Отдельно хотелось бы отметить появление новой высокопроизводительной системы хранения – EMC DSSD. Она является одним из первопроходцев технологии NVMe over Fabrics, используя один из первых и наиболее проработанных вариантов ее реализации – NVMe over PCI-Express. Серверы подключаются к AF-массиву с помощью специализированных адаптеров PCI-Express и кабелей длиной до 4 метров. Использование шины PCI-Express для передачи данных обеспечивает минимально возможные задержки и максимальную на сегодняшний день производительность. Одной из особенностей EMC DSSD является хранение всех данных внутри массива в виде объектов, по этой причине предпочтительно использование API для связи решения с приложениями. Если отсутствует возможность использовать объектный подход, можно применить специальный драйвер для блочного доступа, однако блоки данных на массиве все равно будут храниться внутри контейнеров, что может несколько снижать итоговую производительность. EMC DSSD целесообразно использовать в случае высоконагруженных баз данных для аналитики, решений задач антифрода, High Performance Computing и Big Data.

Используемые накопители

Многие производители используют в качестве flash-накопителей стандартные SSD форм-фактора 2.5” с интерфейсом SAS. Это позволяет применять широко распространенные накопители от разных производителей и легко добавлять новые модели SSD без изменения архитектуры решения.

Вторым подходом является производство специализированных flash-накопителей, чаще всего подключаемых к PCI-Express шине контроллеров. Этот вариант предпочтителен для решений, нацеленных на максимальную производительность, но снижает гибкость дальнейшего развития продукта, т.к. требует значительных затрат на разработку накопителей и чаще всего завязан на одного поставщика. Подобные накопители применяются в массивах Hitachi VSP, IBM FlashSystem, Violin Memory FSP, EMC DSSD, Pure Storage FlashBlade.

Что нас ждет в будущем

Использование стандарта NVMe вместо SAS для подключения flash-накопителей к контроллерам массива обеспечит снижение задержек и повышение производительности. Это станет возможным благодаря использованию высокоскоростной PCI-Express шины и параллелизации запросов вместо последовательной обработки SCSI-команд SAS-контроллерами. При этом физически NVMe-накопители могут быть выполнены в привычном форм-факторе 2.5”, а также в виде PCI-Express модулей.

Реализация технологии NVMe over Fabric для повышения производительности и снижения задержек при передаче данных между серверами приложений и AF-массивом может стать еще одним драйвером этого рынка.

Для чего стоит выбрать All-Flash

Наши заказчики всё чаще внедряют AF у себя в дата-центрах. Приведем несколько примеров. Виртуализация – отличный кейс для применения AF-массивов с дедупликацией. Во-первых, в виртуальных машинах обычно содержится много одинаковой информации (файлы операционных систем), а во-вторых, существует так называемый эффект «блендера». Он заключается в том, что множество виртуальных серверов обращаются к одному дисковому ресурсу одновременно, в итоге образуется по большей части случайная нагрузка на диски, что очень хорошо подходит для SSD и плохо для HDD. Так, один из крупных российских банков, наш заказчик, использует All-Flash в своей виртуальной инфраструктуре для высокопроизводительных виртуальных сред.

В крупных VDI-проектах также целесообразно использование All-Flash. Эффект «блендера» в случае VDI выражен даже ярче, чем при виртуализации серверов. Утренняя загрузка множества виртуальных рабочих мест характеризуется множеством случайных запросов чтения, а в повседневной работе VDI до 90% нагрузки приходится на мелкие записи. Большое количество российских VDI-проектов первой волны провалилось или потребовало доработки как раз из-за серьезных нагрузок на дисковые массивы, которые были не в состоянии обеспечить требуемую производительность. Это приводило к медленной работе приложений и недовольству конечных пользователей.

All-Flash хорошо подходит для обеспечения работы высоконагруженных транзакционных (OLTP) баз данных, обрабатывающих большое количество небольших запросов и при этом очень требовательных к минимальному времени отклика. Например, до внедрения AF-массива для осуществления процессинга топливных карт в крупной нефтяной компании периодически наблюдались проблемы в работе системы на заправках. Большое количество запросов приводило к значительному увеличению времени отклика со стороны дискового массива и, как следствие, к проблемам в работе всего сервиса. Переход на AF полностью снял этот вопрос с повестки дня, и с тех пор сервис топливных карт не испытывает трудностей, связанных с недостатком производительности СХД.

Кроме того, AF (не все решения) имеет смысл использовать для работы систем бизнес-анализа. Стоит отметить, что при построении аналитических отчетов нагрузка на дисковую подсистему значительно отличается от нагрузки в случае виртуальных сред: на первое место здесь выходит не минимальное время доступа к маленьким блокам информации, а максимальная скорость чтения больших объемов данных. Из-за специфики реализации операций записи некоторые AF-массивы демонстрируют не лучшие результаты для BI. Действительно высокую производительность для бизнес-анализа чаще всего демонстрируют массивы, использующие специализированные flash-модули с PCI-Express интерфейсом. Применение компрессии на All-Flash позволяет уменьшить объем, занимаемый базами данных, до 50%, при этом дедупликация обычно не дает существенной экономии места.

Например, в одной крупной страховой компании после переноса аналитических баз данных на All-Flash значительно сократилось время построения бизнес-отчетов. Это ускорило принятие решений. Также в случае необходимости можно создавать новые отчеты без существенного снижения скорости выполнения основных задач.

Об областях применения AF-массивов у телеком-операторов стоит сказать отдельно. По сути, их две – это биллинг и антифрод-решения. Биллинг – одна из важнейших и наиболее нагруженных систем. В случае предоплаченных услуг оператор в режиме реального времени ведет учет потребления трафика и оказания различных сервисов для множества абонентов. Для этого системе хранения требуется обеспечить выполнение большого количества запросов с минимальным временем отклика. При постоплате на основе собранных данных с определенной периодичностью (обычно раз в месяц) создается огромное количество счетов на оплату оказанных услуг. Во время их генерации необходима высокая скорость чтения больших объемов информации за относительно короткий промежуток времени.

Защита от мошенничества подразумевает комплекс задач по проверке финансовых транзакций на подозрительные активности. Один из главных критериев работы антифрод-системы – это скорость анализа поведения пользователя на основе различных алгоритмов. Чем быстрее происходит оценка рисков, тем ниже риски финансовых потерь. При большом количестве операций необходимы высокая производительность и низкое время отклика со стороны СХД. И здесь AF-массивы уверенно обходят традиционные решения. Поэтому один из наших заказчиков – телеком-оператор – для систем биллинга и антифрода использует именно All-Flash. Объем хранящихся на этом массиве данных уже приближается к 80 ТБ.

В большинстве приведенных примеров экономическая эффективность использования AF значительно выше, чем у гибридных массивов. За счет этого компенсируется высокая стоимость AF-массива.

Для чего All-Flash не подойдет

По причине высокой стоимости flash-накопителей и систем AF некоторые виды данных выгоднее хранить на медленных, но дешевых HDD или гибридных массивах. Так, хранить резервные копии и архивы на flash-накопителях совершенно неоправданно, т.к. эти данные не требуют высокой скорости доступа, а основным параметром здесь является экономическая эффективность хранения. Возможно, при появлении требований к быстрому восстановлению из бэкапа и снижении стоимости емких 3D NAND TLC дисков эти задачи станет целесообразно перевести в область ответственности All-Flash.

Также не имеет смысла использовать AF-массивы для мультимедийных данных. Они практически не поддаются сжатию и чаще всего представляют собой достаточно большие файлы, которые читаются и пишутся на диски последовательно. С такой нагрузкой хорошо справляются и механические жесткие диски, которые стоят существенно дешевле SSD.

И несколько слов о варианте применения All-Flash для пользовательских файловых ресурсов: часто они не требуют высокой скорости работы, поэтому пока эффективнее использовать для них обычные дисковые или гибридные массивы.


All-Flash – это будущее, которое быстро и неотвратимо приближается. Стоимость AF-массивов постоянно снижается, и уже сегодня стоит рассматривать варианты перехода на них для большинства задач, требующих высокой производительности и низкого времени отклика.

При этом важно понимать, что All-Flash не является «серебряной пулей» и не решит всех проблем одним своим присутствием. Очень часто медленная работа приложений может быть обусловлена неэффективными запросами к базе данных, неправильным построением логики приложений и ИТ-систем.

При выборе All-Flash массива нужно обязательно погружаться в задачи и требования заказчика, изучать его инфраструктуру и бизнес-процессы, считать бизнес-кейсы и получаемую выгоду. Наша компания, благодаря огромному опыту проектирования как классических решений, так и новых, основанных на flash-технологиях, готова предложить именно ту архитектуру, из которой компания сможет выжать максимум при сохранении инвестиций.

Вернуться к содержанию выпуска
Оставьте комментарий
Мы не публикуем комментарии: не содержащие полезной информации или слишком краткие; написанные ПРОПИСНЫМИ буквами; содержащие ненормативную лексику или оскорбления.
О журнале

Журнал Jet Info регулярно издается с 1995 года.

Узнать больше »
Подписаться на Jet Info

Хотите узнавать о новых номерах.

Заполните форму »
Контакты

Тел: +7 (495) 411-76-01
Email: journal@jet.su