Инфраструктура high availability жизненно необходима для любого современного бизнеса. Попробуем простыми словами объяснить сложные технологии в несколько минут
В этой статье мы дадим определение аварийного восстановления и обсудим, почему оно необходимо, какие типы доступных решений аварийного восстановления, лучшие практики аварийного восстановления, как рассчитать окупаемость инвестиций (ROI) аварийного восстановления и почему важно иметь непрерывность бизнеса. Инфраструктура high availability.
Что такое аварийное восстановление (DR) и инфраструктура high availability?
Аварийное восстановление (DR) относится к процессу, которому компании следуют для восстановления своих систем и данных после техногенной или природной катастрофы. Процесс аварийного восстановления основан на резервном копировании реплицированных производственных данных в удаленном расположении, будь то другой центр обработки данных, офис, частное или общедоступное облако. Когда происходит бедствие, организация может восстановить свои данные из этих резервных копий.
Иногда организация будет использовать удаленное расположение в качестве рабочей площадки до тех пор, пока исходная площадка не будет восстановлена и не заработает. Это составная часто того, что называется инфраструктура high availability.
ТОО Лингуа Мадре оказывает в Казахстане полный спектр услуг по поставке и технической поддержке программного обеспечения для резервного копирования, репликации и синхронизации данных. Свяжитесь с нашими экспертами для получения информации о том, чем мы можем вам помочь. | ||
Инфраструктура high availability. Узнать больше о программном обеспечении Acronis в Казахстане | Связаться с нами |
Разумное аварийное восстановление является важной частью вашего плана обеспечения непрерывности бизнеса.
Что такое целевая точка восстановления (RPO) и целевое время восстановления (RTO)?
Целевая точка восстановления и целевое время восстановления являются критически важными показателями для вашей группы аварийного восстановления. RPO и RTO также имеют решающее значение для анализа влияния на ваш бизнес. Расчет RPO и RTO дополнит защиту данных в случае непредвиденных обстоятельств и упростит планирование непрерывности бизнеса.
RPO обычно относится к расчету того, сколько данных компания может потерять в течение периода, прежде чем будет нанесен значительный ущерб ее критически важным бизнес-операциям, от точки сбоя до последней резервной копии данных.
Узнайте больше информации о том, что входит в план аварийного восстановления | ||
Что такое целевые точки восстановления (RPO) | Что такое целевое время восстановления (RTO) | Как организовать удаленное резервное копирование |
По сути, RPO позволяет компаниям определить, какой объем потери данных они могут допустить во время стихийного бедствия или сценария кибератаки.
RTO обычно относится к периоду, в течение которого система, приложение или процесс могут быть отключены без значительного ущерба бизнес-операциям, а также ко времени, затраченному на восстановление данных, чтобы обеспечить контрольные точки непрерывности бизнеса, установленные в вашем плане, после события сбоя.
Расчет RTO имеет решающее значение для вашего плана аварийного восстановления. Это фундамент инфраструктуры high availability.
Почему аварийное восстановление важно?
Любой бизнес, собирающий данные, должен иметь безопасный и хорошо структурированный план аварийного восстановления. Невыполнение этого требования может привести к массовой потере данных и подорвать доверие к компании и ее репутацию на рынке. Однако даже компании с планами аварийного восстановления и обеспечения непрерывности бизнеса часто могут оказаться незащищенными во время стихийных бедствий или техногенных катастроф, поскольку эти планы никогда не проверялись и не применялись.
В современном мире данные являются ценным товаром. Организации, которые не могут обеспечить целостность и безопасность своих данных, рискуют будущим своего бизнеса. Время простоя может иметь катастрофические последствия для ваших клиентов и вашего дохода. Организациям нужны локализованные и облачные решения для аварийного восстановления, чтобы обеспечить непрерывность бизнеса во всех сценариях. В зависимости от вашего решения аварийного восстановления может быть невероятно сложно обеспечить защиту и восстановление данных при сохранении низких затрат.
Планирование аварийного восстановления, чтобы помочь вашему бизнесу избежать потери данных
Предприятие может использовать несколько типов планов аварийного восстановления для защиты своих данных и сведения к минимуму времени простоя. Хотя большинство скажут вам, что существует три типа аварийного восстановления — холодное, теплое и горячее — существуют также некоторые варианты этих альтернатив, которые обсуждаются ниже.
Резервное копирование на удаленный сайт
В то время как некоторые предприятия малого и среднего бизнеса выполняют резервное копирование своих данных на удаленную систему или на магнитную ленту или накопитель, который доставляется за пределы площадки, резервное копирование не считается настоящим решением для аварийного восстановления, поскольку оно не касается восстановления с точки зрения целей точки восстановления. (RPO) и целевое время восстановления (RTO).
Резервное копирование как услуга
Резервное копирование как услуга — это то же самое, что и резервное копирование данных в удаленное место, за исключением того, что эта услуга предоставляется сторонним поставщиком.
Моментальные снимки на момент времени
Моментальный снимок или копия на момент времени — это копия базы данных в том виде, в каком она появляется в данный момент времени. В целях аварийного восстановления моментальный снимок должен храниться за пределами площадки. (в основном для противодействия местному стихийному бедствию)
В зависимости от времени создания моментального снимка может произойти некоторая потеря данных.
Холодные сайты инфраструктуры high availability
Площадка для холодного аварийного восстановления — это офис или центр обработки данных вдали от основной площадки с электричеством, отоплением, кондиционированием воздуха и т. д., но без работающих ИТ-систем. Сотрудники могут работать на «холодной площадке» в случае аварии, чтобы обеспечить непрерывность бизнеса и выполнение операций, но никакие технологии не установлены. В зависимости от продолжительности стихийного бедствия организация может установить необходимые системы после стихийного бедствия, чтобы поддерживать функционирование бизнеса. Этот тип сайта является наименее дорогим вариантом для восстановления данных по сравнению с теплыми и горячими сайтами.
Теплые сайты для аварийного восстановления
Теплая площадка для аварийного восстановления предлагает офисные помещения и технологическую инфраструктуру, используемую в случае аварии на основной площадке. На теплом объекте есть электроэнергия, отопление, кондиционирование воздуха, средства пожаротушения и т. д., но также имеется сетевое подключение и резервное аппаратное/программное обеспечение, уже настроенное и работающее. Резервное копирование с основного сайта на теплый выполняется ежедневно или еженедельно, что может привести к некоторой потере данных. Этот тип сайта является вторым самым дорогим вариантом после горячего сайта.
Горячие сайты аварийного восстановления
Горячая площадка для аварийного восстановления предлагает офисные помещения и полную копию ИТ-инфраструктуры, систем, приложений и актуальных данных основного сайта для продолжения работы сразу после аварии. Горячий сайт стоит дорого, но это лучший вариант для быстрого возобновления нормальной работы бизнеса.
Аварийное восстановление как услуга (DRaaS)
DRaaS — это услуга, при которой организация выполняет резервное копирование своих систем и данных в общедоступное облако, управляемое сторонним поставщиком облачных услуг. Провайдер взимает плату с оплатой по мере использования, которая взимается ежемесячно или ежегодно. Чтобы считаться настоящим вариантом аварийного восстановления, инфраструктура DRaaS должна располагаться вдали от основной площадки.
План виртуального аварийного восстановления
С помощью виртуального решения аварийного восстановления вы создаете копию всей своей ИТ-инфраструктуры и запускаете ее на удаленных виртуальных машинах (ВМ). Поскольку виртуальные машины не зависят от оборудования, вы легко загружаете резервную копию и восстанавливаетесь после сбоя всего за несколько минут.
Мгновенное восстановление
Благодаря мгновенному восстановлению вы можете сделать снимок всей виртуальной машины и запустить другую виртуальную машину из этой резервной копии. Вторичная виртуальная машина должна находиться в месте, не затронутом аварией, чтобы эффективно защитить данные.
Что такое облачное аварийное восстановление?
Облачное аварийное восстановление (CDR) — один из самых эффективных планов аварийного восстановления. Это облачное решение, позволяющее быстро восстановить потерянные данные в случае аварии. Он также обеспечивает удаленный доступ ко всем облачным системам в защищенной виртуальной среде.
Управляемый CDR не требует наличия сетевой инфраструктуры для ваших резервных копий, поскольку все они находятся в облаке провайдера. Вам не нужно беспокоиться об отказе оборудования, управлении центром обработки данных или физических бедствиях.
В отличие от традиционных стратегий аварийного восстановления, CDR расширяет возможности организации по эффективному восстановлению важных данных при одновременном снижении затрат на восстановление в соответствии с оптимальным бюджетом.
Рекомендации по аварийному восстановлению для защиты бизнес-операций
Размещайте производственные и аварийные ЦОДы в разных регионах
Чтобы обеспечить эффективный план аварийного восстановления, вы должны хранить резервные копии в одном или нескольких местах, которые не находятся рядом с вашим основным сайтом. В идеале эти центры обработки данных должны быть расположены в отдельных энергосистемах, чтобы свести к минимуму перебои в подаче электроэнергии и упростить управление кризисными ситуациями. Как правило, вы хотите хранить резервные копии данных на расстоянии не менее 150 миль от основного сайта. Это сводит к минимуму вероятность того, что ваши данные пострадают в результате одной аварии.
Проверьте свою стратегию аварийного восстановления
Чтобы ваша стратегия аварийного восстановления была эффективной, вы должны регулярно проводить тесты и применять свой план. Непроверенные планы вряд ли сработают в чрезвычайной ситуации, особенно если ваш план касается нескольких сотрудников, следующих особым процедурам.
Чтобы эффективно протестировать план, вы должны изучить все системы и процессы на наличие структурных недостатков и других угроз безопасности. Написание контрольного списка и пошаговое руководство по восстановлению — это отличный способ убедиться, что вы готовы к чрезвычайной ситуации. Затем придумайте фиктивные сценарии, чтобы найти слабые места в вашем плане. Это может быть так же просто, как предвидеть отказ генератора электроэнергии. Спросите: «Если это не удастся, что еще мы можем сделать?»
Вы можете продолжить обнаружение нежелательных событий, которые потенциально могут привести к непредвиденным простоям. Охват всех сценариев делает восстановление доступа к вашим критически важным данным максимально оптимальным.
Убедитесь, что персонал обучен выполнению плана аварийного восстановления.
Вместо того, чтобы возлагать ответственность за планирование аварийного восстановления на нескольких специалистов, гораздо лучше обучить нескольких сотрудников на случай, если некоторые из них будут недоступны во время аварии. Также рекомендуется подготовить команду за пределами вашего основного региона центра обработки данных, чтобы гарантировать непрерывность бизнеса для всех ваших местоположений.
Как рассчитать рентабельность планов аварийного восстановления?
Расчет рентабельности инвестиций в аварийное восстановление выглядит следующим образом:
ROI = (предотвращенные убытки – затраты на решение аварийного восстановления) / затраты на решение аварийного восстановления x 100 %.
Вот цифры, которые вам нужны для расчета. Во-первых, давайте посчитаем предотвращенные потери.
Предотвращенные потери = потери из-за незащищенного простоя – защищенные потери из-за простоя
Незащищенный простой
Это время, которое потребуется вам для восстановления работы компании без решения аварийного восстановления.
Защищенное время простоя
Это время, которое потребуется вам для продолжения работы с решением аварийного восстановления.
Часовая выручка реализации
Разделите годовой доход вашей компании на количество рабочих часов в календарном году.
Чтобы определить потери из-за незащищенного простоя и потери из-за защищенного простоя, умножьте оба времени простоя на почасовой доход.
Предотвращенная потеря
Вычтите потери из-за защищенного простоя из потерь из-за незащищенного простоя.
Это первый компонент вашего расчета ROI.
Второй компонент рентабельности инвестиций — это стоимость вашего решения аварийного восстановления. Вы можете связаться с Acronis, чтобы определить стоимость аварийного восстановления для вашей конкретной среды. Тогда у вас будут все компоненты, необходимые для расчета ROI. Прежде чем представить свой расчет рентабельности инвестиций вашей управленческой команде, вы должны попросить своего финансового директора дать рекомендации относительно того, что они считают хорошей рентабельностью инвестиций.
В чем разница между планом аварийного восстановления и планом обеспечения непрерывности бизнеса?
Когда дело доходит до полной готовности к любой аварии, аварийное восстановление и планирование обеспечения непрерывности бизнеса идут рука об руку.
Разница между аварийным восстановлением и непрерывностью бизнеса заключается в том, что первое касается восстановления ИТ-инфраструктуры компании, а второе — восстановления бизнес-процессов.
Планирование обеспечения непрерывности бизнеса (BCP) — это «процесс, связанный с созданием системы предотвращения и устранения потенциальных угроз для компании. План гарантирует, что персонал и активы защищены и могут быстро функционировать в случае аварии».
Планирование непрерывности бизнеса вступает в игру во время стихийных бедствий и других непредвиденных событий, таких как серьезное нарушение безопасности, болезнь или смерть руководителя компании, пандемия, гражданские беспорядки и т. д.
ТОО Лингуа Мадре оказывает в Казахстане полный спектр услуг по поставке и технической поддержке программного обеспечения для резервного копирования, репликации и синхронизации данных. Свяжитесь с нашими экспертами для получения информации о том, чем мы можем вам помочь. | ||
Инфраструктура high availability. Узнать больше о программном обеспечении Acronis в Казахстане | Связаться с нами |
Хороший план аварийного восстановления является важным компонентом вашего плана обеспечения непрерывности бизнеса. Это дорожная карта, определяющая шаги по возобновлению ИТ-операций и восстановлению ИТ-инфраструктуры, включая сеть, серверы, рабочие столы, базы данных, приложения и другие ИТ-компоненты.
Управление непрерывностью бизнеса включает в себя различные методы аварийного восстановления, антикризисное управление, регулярное тестирование аварийного восстановления, внутреннюю и внешнюю связь, доступные сайты аварийного восстановления, протоколы отключения сети, анализ влияния на бизнес и хорошо подготовленную группу аварийного восстановления для обеспечения доступности критически важных бизнес-функций. в любое время, чтобы возобновить нормальную работу.
Поиск лучшего решения для аварийного восстановления для вашего бизнеса
По своей сути аварийное восстановление сосредоточено на создании страхового полиса.
Но точно так же, как вы должны выбрать страховое покрытие, которое соответствует вашим потребностям и бюджету, стратегия аварийного восстановления и решение, которые вы развертываете, должны быть тщательно выбраны. Крупные организации с обширными ИТ-ресурсами и опытом могут быть готовы управлять своим аварийным восстановлением напрямую, используя комплексное решение, такое как Acronis Cyber Disaster Recovery . Простая в развертывании и управлении, она обеспечивает мгновенную доступность всех рабочих нагрузок — как локальных, так и облачных — в случае аварии. Он также включает изолированную среду тестирования, поэтому ИТ-специалисты могут гарантировать, что система будет поддерживать работу бизнеса, что бы ни случилось.
Хотя малым и средним предприятиям может не хватать ресурсов, необходимых для аварийного восстановления, они по-прежнему сталкиваются с теми же рисками сбоев. Стоимость незапланированного простоя может быть еще более фатальной для их операций. Многие предприятия малого и среднего бизнеса полагаются на поставщиков управляемых услуг (MSP) для удовлетворения своих ИТ-потребностей, включая управляемые услуги аварийного восстановления. Платформа киберзащиты, такая как Acronis Cyber Cloud, MSP может обеспечить несколько уровней защиты, включая резервное копирование и аварийное восстановление в качестве услуги, чтобы данные, приложения и системы, используемые этими небольшими компаниями, всегда были доступны и защищены.
Эта гибкость означает, что любая организация, независимо от размера, может развернуть соответствующую стратегию аварийного восстановления, чтобы справиться с любыми трудностями, с которыми она сталкивается.