• Звонок по России бесплатный 8 800 200-59-60
  • Москва +7 (495) 232-92-30
  • Санкт-Петербург +7 (812) 327-59-60
  • Екатеринбург +7 (343) 378-41-50
Катастрофоустойчивые решения Катастрофоустойчивые решения

Катастрофоустойчивые решения

Для ИТ-сервисов такие риски как пожар в ЦОД, природные бедствия и т.п. способны привести к длительному простою, который недопустим в рамках имеющихся требований бизнеса.

Для крупных компаний, которым необходимо поддержание гарантированной работоспособности ИТ-сервисов 24 часа в сутки, минимизация рисков, связанных с крупными авариями, требует наличия катастрофоустойчивых, территориально-распределенных систем.

Непрерывная защита данных:

Средствами СХД и SAN Средствами гипервизора Средствами ПО

 

Предварительный детальный анализ рисков и их влияния на бизнес позволяет получить граничные условия для времени простоя и возможных потерь данных. На основе этих данных можно делать выбор оптимального решения и создание плана восстановления при аварии.

В зависимости от предъявляемых требований, решение может включать два (или более) центра обработки данных (ЦОД). Наличие резервной площадки позволит, в случае аварии, частично или полностью восстановить ИТ-сервисы в кратчайшие сроки.

Однако, вне зависимости от выбранной стратегии, для любой резервной площадки необходимо наличие полной и актуальной копии данных (СУБД, файлы и т.п.).

В настоящее время, можно выделить 3 принципиальных подхода к построению катастрофоустойчивых решений:

  • наличие на удаленной площадке полной копии данных в любой момент времени (данные постоянно передаются на удаленную площадку - синхронная репликация)
  • наличие на удаленной площадке полной копии данных с некоторым отставанием по времени от актуальных (данные периодически передаются на удаленную площадку - асинхронная репликация)
  • возможность параллельной работы с данными на обеих площадках одновременно (распределенная система)

На практике, различные подходы обычно сочетаются в рамках одного проекта, в зависимости от требований к производительности и времени восстановления. В частности, довольно широко распространен вариант построения катастрофоустойчивой системы на базе трех сайтов: между двумя из них (основными) данные реплицируются синхронно (как правило, имеется небольшое расстояние между этими ЦОД), а на третью площадку осуществляется асинхронная репликация. Данное решение позволяет обеспечить не только быстрое восстановление при проблемах в одном из основных ЦОД, но и защиту от более серьезных катастроф, а также от случайного повреждения данных в основной системе.

Обеспечивать передачу данных между ЦОД можно на самых различных уровнях:

  • на уровне системы виртуализации (гипервизора)
  • на уровне приложений и операционной системы
  • на уровне системы хранения данных (СХД) или сети хранения (SAN), за счет специальных программно-аппаратных решений

Планирование и построение катастрофоустойчивой инфраструктуры не заканчивается после внедрения какого-либо программного или аппаратного решения.

Не менее важную роль в проекте играют планирование сети, каналов связи, периодическое тестирование, обучение персонала и многое другое.

Катастрофоустойчивая система это не разовый проект, а цикличный процесс, требующий детального планирования, аудита и постоянного внимания. Ключевыми этапами являются:

  • определение целей в рамках бизнес-задач
  • идентификация рисков
  • оценка рисков
  • внесение изменений
  • мониторинг и тестирование

Специалисты Тринити готовы провести заказчика по всему циклу, внедрить систему и разработать план дальнейшей поддержки решения.

  

 

Система Orphus