Как в космосе
Сетевые решения Сетевые решения

Почему резервирование - важнейшее условие отказоустойчивости ЦОД

Сетевые решения Проект

Как в космосе

Дата публикации:
25.03.2025
Посетителей:
88
Просмотров:
69
Время просмотра:
2.3

Авторы

Автор
Александр Кушнер руководитель группы проектирования решений по передаче данных компании «Инфосистемы Джет»

/ Базовый принцип отказоустойчивости — резервирование модулей

 

/ Несколько Active-Active ЦОД с растянутыми L2-сегментами — лучшее решение для компаний с ИТ-инфраструктурой, распределенной в рамках одного крупного города


/ Надежные ЦОД необходимы всем компаниям — вне зависимости от их размера и отрасли

Широкое внедрение цифровых сервисов сделало компании максимально чувствительными к инцидентам, затрагивающим их ИТ-инфраструктуру: от ее стабильной работы зависят бизнес-процессы. Выход из ситуации — переход к дублированию компонентов ЦОД, которое традиционно используется в космической и авиационной технике. О том, как можно добиться космической надежности в ИТ, рассказал эксперт компании «Инфосистемы Джет».

 

Резервное плечо работает всегда

Таким образом, в стандартной модели функционирования сетей многие серверы выступают в качестве посредников: они получают данные, распознают тип их целевого приложения, готовят информацию для дальнейшей передачи и отправляют ее по целевому назначению.

 

Чем больше размер кластера, тем выше вероятность того, что трафик будет попадать не на свой node, а доля мощностей, которые нерационально задействованы в его обработке, будет расти.

«Базовый принцип обеспечения отказоустойчивости внутри ЦОД - это резервирование его модулей. Например, сети в современных ЦОД строятся на базе EVPN-VXLAN-фaбpuк, которые уже давно являются мировым стандартом. Использование их топологии (CLOS) подразумевает применение резервируемых коммутаторов на каждом уровне сети и экономит количество линий связи для соединения модулей. Благодаря такой схеме резервирования, выход из строя одного из устройств не приводит к остановке работы ЦОД и последствия аварии ограничиваются лишь временным снижением пропускной способности. Не менее важно и то, что в штатном режиме данное резервное плечо не простаивает, а активно используется системой для эффективного распределения трафика между ее элементами по правилам ЕСМР».

Александр Кушнер

Более масштабная задача - обеспечение отказоустойчивости ИТ-инфраструктуры в ситуации, когда в компании планируется использование сразу нескольких ЦОД, в особенности если они расположены на значительном расстоянии друг от друга (более 40 км). В этом случае организовать растянутые L2-сети без серьезных задержек в них не представляется возможным. А отсутствие данных сетей не позволит провести простое переключение трафика с сохранением адресации в резервный ЦОД во время аварийной ситуации (например, переключение с петербургского центра на московский). Изменение адресации, в свою очередь, может сильно увеличить срок восстановления работоспособности систем, которые тяжело переживают смену IР-адресов на ключевых компонентах. Как правило, это старые и самописные приложения (Legacy), однако многие российские компании продолжают их эксплуатировать в большом количестве. Итогом данной ситуации может стать отказ ПО.

 

Подобных проблем удается избежать путем выстраивания у клиентов инфраструктуры, состоящей из нескольких Active-Active ЦОД с растянутыми L2-сегментами, ресурсы которых различные приложения используют одновременно. В результате при выходе из строя одного из них единственным последствием станет снижение ресурсной базы, а все необходимые адреса, к которым обращаются приложения, останутся теми же.

 

Добиться отказоустойчивости можно как на этапе проектирования ЦОД с нуля (и это наиболее предпочтительный вариант), так и на стадии эксплуатации уже установленного оборудования – путем изменения его конфигурации и архитектуры, если резервирование не было предусмотрено изначально либо использующиеся технологии устарели. Во втором случае, как правило, последовательно выполняются следующие действия: аудит ИТ-инфраструктуры заказчика, составление рекомендаций по ее улучшению, их реализация.

Пицца-боксы объединяются

 

В деле повышения отказоустойчивости не менее важен и тип используемого оборудования. Так, при создании ЦОД прошлых поколений их проектировщики просто объединяли два огромных коммутатора (например, таких как Cisco Nexus 7000 Series) на большое количество слотов и подключали к ним все оборудование, имеющееся в наличии. В результате получалась конфигурация, которая при аварии становилась единой точкой отказа. При этом масштабировать ее было крайне сложно: например, если требовалось увеличить портовую емкость (такая потребность возникает на практике часто), то нужно было заменять устройства на еще большие либо добавлять выносные карты (FЕХ-коммутаторы), которые используют control plane основного Nexus.

 

Современные же ЦОД строятся на небольших одноюнитовых устройствах с говорящим названием «пицца-боксы», которые не объединены друг с другом. Такое построение позволяет легко масштабировать и модернизировать фабрики, а возможная потеря одного или нескольких элементов этого ЦОД не будет критичной, поскольку их с легкостью можно поменять на новые.

Отказоустойчивые ЦОД необходимы всем компаниям, обладающим ИТ-инфраструктурой, вне зависимости от их размера и отрасли. При создании таких центров используется единый подход к строительству (многокаскадная сеть Клоза, заимствованная ИТ-специалистами из аналоговой телефонии) и варьируется лишь масштаб требуемого решения: от нескольких стоек в небольшой организации до десятков шкафов в крупных банках и торговых компаниях.

Более 90% клиентов компании «Инфосистемы Джет» уже приняли решение использовать ИТ-инфраструктуру с резервным ЦОД. Как минимум он будет задействован для запуска наиболее критических сервисов в случае аварии на основной площадке. В некоторых случаях функции резервного ЦОД можно реализовать, используя облачные сервисы и размещая серверное оборудование на сторонних площадках по схеме co-location.

В настоящее время идея внедрения отказоустойчивых ЦОД очень популярна среди многих российских компаний: они не хотят лишиться бизнеса в результате банального отключения электроэнергии в здании, где расположена их единственная серверная. Как правило, компании решаются на модернизацию своей ИТ-инфраструктуры лишь тогда, когда становится понятно, что используемое ими оборудование морально устарело и начинает сбоить (например, периодически зависает и выдает различные ошибки), либо когда его уже невозможно масштабировать под расширяющиеся задачи. И мы помогаем заказчикам решать такие проблемы, используя передовые технические решения.

 

Если говорить о ситуации с доступом к оборудованию отказоустойчивых ЦОД, то большим плюсом для компаний стало наличие оборудования для построения EVPN-VXLAN-фaбpик у целого ряда российских вендоров, включая такие компании, как ELTEX, QTECH, B4Com и т. д. Если же заказчик предпочитает использовать иностранное оборудование, компания «Инфосистемы Джет» может предложить ему расширение ЦОД за счет импортных решений и его полное сервисное обслуживание. Такой подход не только обеспечивает работоспособность текущих решений, функционирующих на иностранном оборудовании, но и позволяет создавать новые ЦОД на основе российских систем.

Уведомления об обновлении тем – в вашей почте

Дата-центр. Скрытые резервы

С каждым годом возрастает зависимость компаний от информационных ресурсов как внутренних, так и внешних. Соответственно, так же возрастает и цена самой информации, что диктует повышенные требования к производительности и надежности ИТ-структуры.

Там, где живут серверы

Различные достижения ИT-индустрии проникли во все сферы нашей деятельности, прочно вошли в быт и воспринимаются уже как нечто совершенно естественное и обыденное. Мобильная связь, Интернет, электронная почта – человек не может обходиться без этих «простых» и нужных услуг.

Модульные ЦОДы

Основой для возникновения этого решения в свое время послужили мобильные ЦОДы

Роль Quality Assurance, или Шпионские страсти ЦОДостроения

Если поностальгировать и вспомнить Центры обработки данных конца 1990-х годов, то практически все они были консервативными с точки зрения используемых технологий. Ситуация изменилась в начале XXI века в связи с ростом объемов корпоративных данных, а также количества используемых компаниями бизнес-приложений.

«Кешбэк от DCIM — это когда решение высвобождает до 30% ресурсов ЦОД»

Почему тема DCIM сейчас особенно актуальна? Во сколько обойдется такой проект? Как работает кешбэк от DCIM? Какие ошибки допускают заказчики при внедрении?

Что такое White Box и почему о нем стоит задуматься?

В чем преимущества решений White box? Личный опыт: тестирование Asterfusion и Edgecore. Как и где стоит применять White box?

Программно-определяемый ЦОД - рецепт приготовления

Программную определяемость ЦОД можно обеспечить, используя ряд ИТ-технологий и инструментов. В этой статье мы рассмотрим некоторые из них

Миграционный вопрос

Как организовать и провести ИТ-миграцию, обеспечить безболезненный переезд ИТ-систем

Сокращение энергопотребления систем кондиционирования

Цель, к которой неизменно стремятся инженеры-климатехники дата-центров, – терминация холодного воздуха максимально близко к источнику локальной генерации тепла.

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал






    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему








      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал








        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости








          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору









            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня