Чтобы предотвратить убытки, необходимо обеспечить резервную ИТ-инфраструктуру, которая будет хранить информацию о ключевых бизнес-процессах и иметь ресурсы для поддержания их работоспособности.
Выбираем способ организации резервной инфраструктуры
Есть огромное количество вариантов построения резервной инфраструктуры. Перечислю основные из них:
- использование собственного дата-центра;
- аренда площади в коммерческих дата-центрах;
- аренда инфраструктуры (Infrastructure as a Service, IaaS);
- аренда сервисов (Disaster Recovery as a Service, DRaaS).
Определяем стоимость лучшего варианта
Для того чтобы выбрать оптимальный вариант среди многообразия предлагаемых рынком решений и не переплатить, необходимо выполнить следующие основные шаги:
- провести анализ воздействия на бизнес различных факторов (Business Impact Analysis, BIA), сформулировать и согласовать требования к непрерывности бизнес-процессов и услуг;
- определить технологии резервирования данных и систем;
- подготовить технико-экономическое обоснование выбранных технологий и способов;
- определить способ организации резервной инфраструктуры;
- спроектировать решения по резервированию.
Если по итогу всех мероприятий будет принято решение о строительстве собственного ЦОДа, то к вышеописанным шагам следует добавить еще 2 пункта:
- в соответствии с расчетным объемом оборудования и прогнозом роста ИТ-систем спроектировать и рассчитать размер дата-центра и стоимость его инженерных подсистем;
- спрогнозировать возможные дополнительные затраты, например на коммунальные платежи.
Считаем CAPEX и OPEX
Как и любой инвестиционный проект, решение о построении или использовании дополнительной ИТ-инфраструктуры должно приниматься на основе тщательного анализа всех факторов, влияющих на конечную стоимость. Для поиска максимально эффективного экономического решения необходимо подсчитать совокупную стоимость владения резервной инфраструктурой для каждого способа его организации. Исследуются все затраты компании на организацию и поддержку резервного решения на определенном промежутке времени (обычно это 3, 5, 7 лет).
Определяем целевое время восстановления и его стоимость
В рамках BIA определяют финансовые потери при выходе из строя ключевых ИТ-ресурсов, а также оценивают значения RTO (Recovery Time Objective) и RPO (Recovery Point Objective). RTO показывает время, необходимое для восстановления ИТ-ресурсов после сбоя, а RPO определяет время максимально допустимых потерь данных до момента возникновения сбоя.
Для каждого показателя определяют технологии по резервированию и его стоимость. На изображенной ниже шпаргалке видно, что если RTO/RPO определены бизнесом в минутах и часах, то в качестве способа резервирования подходит кластер с синхронной репликацией. А если значения RTO больше (например, несколько дней), то речь может идти о восстановлении из бэкапов. Соответственно, чем быстрее бизнесу нужно восстановиться после сбоя, тем дороже будет техническая реализация решения.
Следующий шаг в технико-экономическом обосновании — сравнение вероятных финансовых потерь со стоимостью решения по резервированию. И последняя не должна превышать вероятные потери, иначе теряется весь смысл защиты от катастроф. В таком случае с точки зрения бизнеса проще «пережить» потери, чем тратить время и деньги на резервирование.
Но что делать, когда стоимость самого дешевого варианта по резервированию финансово превышает вероятные потери бизнеса от сбоев? В таком случае необходимо найти компромисс и совместно с бизнесом ответить на вопрос: с какими данными можно расстаться, а с какими — ни в коем случае нельзя? Найдя эту точку «невозврата», следует проанализировать доступные способы резервирования. Рисунок ниже иллюстрирует этот подход. После аварии с течением времени потери компании увеличиваются экспоненциально, как снежный ком. С другой стороны, стоимость решений по резервированию уменьшается с увеличением значения RTO/RPO. Таким образом, реализация решений, находящихся левее точки пересечения (отмечена зеленой звездочкой), бессмысленна с точки зрения бизнес-затрат. Все варианты, расположенные справа от зеленой звездочки, можно рассматривать в качестве подходящих решений по резервированию.
Рассчитываем TCO правильно
От того, как будет посчитана TCO-модель резервного ЦОДа (полная стоимость владения — Total Cost of Ownership), зависит выбор конкретного решения. Как я говорил ранее, самый простой в оценке — вариант DRaaS, а самый сложный — собственный ЦОД.
Рассмотрим совокупную стоимость владения для DRaaS-модели владения резервным ЦОДом. В нее входят сумма ежемесячных платежей и расходы на периодическую учебную миграцию данных из основного ЦОДа в резерв. Необходимо иметь в виду: если инфраструктура продуктивного дата-центра растет на 20–30% в год, платежи за услугу DRaaS также будут расти. Увеличивается количество данных для восстановления — повышается стоимость хранения этих данных.
Намного интереснее выглядит расчет TCO для собственного ЦОДа. Так как он не строится за неделю, то и затраты мы разбиваем на несколько годовых итераций. В траты за первый год закладываем расходы на проектирование и строительство ЦОДа, в том числе на покупку здания, создание инженерных систем и их поддержку.
К стоимости второго года относят затраты на проектирование и развертывание всей необходимой ИТ-инфраструктуры. Кроме того, нужно учесть расходы на лицензии, поддержку «железа» и ПО.
Расходы в течение третьего, четвертого и пятого годов включают в себя затраты на запуск резервных решений и оплату труда сотрудников, на расширение мощностей и информационное «выравнивание» резервного ЦОДа по отношению к основному (то есть данные в активном и резервном дата-центрах всегда должны дублировать друг друга). Также остаются затраты на учебные миграции.
Последние шаги
Построение решений по резервированию ИТ-ландшафта может быть значительно растянуто во времени. Такие проекты ресурсоемки. Бизнес обычно хочет большей прозрачности в определении стоимости резервирования данных и расходов для достижения получаемого результата. В этом может помочь график, который проиллюстрирует, как год за годом снижается вероятность возникновения риска потерь данных при наличии площадки с резервными данными.
Результат
В результате проведенных подсчетов руководство получает необходимые данные для принятия решения о построении катастрофоустойчивого ИТ-ландшафта. Алгоритм принятия решения о целесообразности резервирования прозрачен как для ИТ, так и для бизнеса, что делает процесс бюджетирования гораздо более простым. Важно отметить, что первые шаги — оценка влияния чрезвычайных ситуаций на бизнес и расчет TCO-модели — должны выполняться максимально качественно, так как именно от них зависит выбор оптимального варианта резервирования. Помимо этого, нужно принимать во внимание стратегические цели ИТ и бизнеса в целом, опыт и специфику компании, а также существующие ограничения. Такого рода задачи комплексные и требуют как минимум системного подхода. А как максимум — привлечения профессионалов.