RTO i RPO – kluczowe parametry disaster recovery

Docelowy czas odzyskiwania (RTO) oraz docelowy punkt odzyskiwania (RPO) to kluczowe wskaźniki, które mają fundamentalny wpływ na efektywność strategii Disaster Recovery. Umiejętne stworzenie Disaster Recovery Plan uwzględniającego RTO i RPO pozwoli zapewnić organizacji możliwie wysoki poziom Business Continuity.

Czym jest RTO (Recovery Time Objective)?

Wskaźnik RTO (Recovery Time Objective) określa jak szybko infrastruktura IT jest przywrócona do pracy po wystąpieniu awarii lub innego incydentu. Innymi słowy: wskaźnik RTO określa czas od awarii do przywrócenia ciągłości biznesowej organizacji.

Recovery Time Objective powinien być dostosowany do branży, specyfiki oraz skali przedsiębiorstwa. Przykładowo mały sklep internetowy jest w stanie poradzić sobie z RTO wynoszącym nawet kilkadziesiąt godzin. Z kolei utrata ciągłości biznesowej nawet na jeden dzień dla dużego przedsiębiorstwa z branży e-commerce, finansów czy sektora produkcyjnego może prowadzić do nieodwracalnych strat materialnych i wizerunkowych.

W przypadku przedsiębiorstw outsourcujących usługi IT w obszarze DR, wskaźnik RTO należy uwzględnić w zawartej umowie SLA, czyli umowie o gwarantowanym poziomie świadczenia usług. Określa ona m.in. poziom dostępności usług, czas odpowiedzi oraz czas od zgłoszenia awarii do jej naprawy.

Warto zwrócić uwagę, że Recovery Time Objective określa nie tylko czas potrzebny na reakcję, ale również czas wymagany do przywrócenia procesów, oprogramowania i infrastruktury IT do znamionowego stanu pracy.

RTO oblicza się głównie na podstawie uprzednio sporządzonego planu zarządzania ryzykiem. Jest ono określane w ramach Disaster Recovery Planning. Obliczając wskaźnik RTO, należy wziąć pod uwagę przede wszystkim koszt każdej godziny przestoju, priorytetyzację systemów i aplikacji pod względem ich krytyczności dla ciągłości biznesu, a także oszacować czas niezbędny do wdrożenia kroków polegających na przywróceniu procesów organizacji po wystąpieniu awarii.

Czym jest RPO (Recovery Point Objective)?

Wskaźnik RPO (Recovery Point Objective) określa dopuszczalną ilość utraconych danych i maksymalny akceptowalny czas pomiędzy wystąpieniem awarii, a backupem danych. W przedsiębiorstwie produkcyjnym utrata krytycznych danych może doprowadzić do przestoju całej linii produkcyjnej i skutkować utratą całej partii produktu oraz narażeniem firmy na wielomilionowe straty. Przykłady ile kosztuje organizacje awaria IT przedstawiamy tutaj.

RPO pozwala oszacować akceptowalną do utraty ilość danych. Niektóre przedsiębiorstwa szacują wskaźnik RPO na podstawie zestawienia kosztów pamięci masowej w porównaniu do kosztów odzyskania danych. Takie obliczenia ułatwiają określenie częstotliwości interwałów, w których wykonywane są kopie zapasowe. Strategią obieraną przez inne przedsiębiorstwa jest bieżące tworzenie kopii zapasowych w chmurze. Takie rozwiązanie pozwala uzyskać wyjątkowo krótki czas potrzebny na przywrócenie ciągłości biznesowej oraz znacząco ogranicza dane utracone w wyniku awarii.

Niemniej, rozwiązanie to nie jest pozbawione wad. Zdarza się, podobnie jak w przypadku tworzenia kopii zapasowych, że firmy budują ośrodek zapasowy w tej samej lokalizacji, w której funkcjonuje infrastruktura podstawowa. W przypadku większości awarii katastrofa dotknie zarówno lokalizację podstawową, jak i Disaster Recover Center. Poza tym posiadanie planu DR nie gwarantuje, że będzie on skuteczny. Wiele organizacji cierpi m.in. na braki kadrowe uniemożliwiające przeprowadzenie skutecznego planu Disaster Recovery, brak oprocedurowania czy narzędzi niezbędnych do odzyskania danych. Z tego też powodu firmy coraz częściej decydują się na skorzystanie z usług DraaS (Disaster Recovery as a Services).

Wskaźnik Recovery Point Objective można podzielić na 3 kategorie w zależności od czasu oraz stosowanej technologii.

  • RPO bliskie zeru – dzięki strategii Disaster Recovery opartej na rozwiązaniach w chmurze możliwe jest redundantne tworzenie kopii zapasowych oraz replikacja danych w czasie rzeczywistym. Dzięki temu organizacje stosujące tego typu rozwiązania są w stanie uzyskać możliwie mały wskaźnik RPO. 
  • Do 4 godzin – Disaster Recovery Plan oparty na ciągłym wykonywaniu kopii zapasowych przechowywanych w chmurze pozwala ograniczyć liczbę danych utraconych w wyniku nagłej awarii. Zwykle kopie zapasowe wykonywane są z częstotliwością kilku godzin. 
  • 8–24 godzin – RPO na takim poziomie osiągane jest zwykle w wyniku tworzenia kopii zapasowych na zewnętrznej pamięci masowej. W takim scenariuszu ostatnia kopia zapasowa stanowi jednocześnie punkt przywracania. 

RPO oblicza się także na podstawie szacowania poziomów ryzyka. W przypadku wystąpienia awarii część danych może zostać utracona bezpowrotnie. Dlatego też wskaźnik RPO pozwala oszacować, które dane mogą być utracone bez istotnego wpływu na jakość i ciągłość prowadzonego biznesu.

Szacując wskaźnik RPO, należy uwzględnić maksymalną akceptowalną liczbę utraconych danych, koszt tych danych oraz koszt wdrożenia rozwiązań umożliwiających przeprowadzenie odzyskania danych.

RTO (Recovery Time Objective) vs. RPO (Recovery Point Objective)

Recovery Time Objective i Recovery Point Objective mogą brzmieć podobnie, jednak są to dwa zupełnie różne wskaźniki. Zrozumienie różnicy między nimi jest podstawą wdrażania skutecznego planu odzyskiwania danych.

RTO określa ilość czasu potrzebną do przywrócenia systemu po wystąpieniu awarii. Z kolei RPO jest kalkulacją uwzględniającą akceptowalną dla organizacji utratę danych w wyniku awarii.

RTO i RPO - Disaster Recovery Plan

Rys. 1 RPO i RTO – odtwarzanie po awarii

Poznaj usługi wspierające opracowanie planu Disaster Recovery!

Odkryj dostępne modele Disaster Recovery i wybierz odpowiednią usługę dla Twojej organizacji. Porównujemy wady i zalety dostępnych rozwiązań i narzędzi do odtwarzania awaryjnego.

Pobierz poradnik o rozwiązaniach Disaster Recovery.