RTO a RPO: zrozumienie kluczowych różnic w kontekście odzyskiwania po awarii
Organizacje w coraz większym stopniu polegają na kopiach zapasowych, aby chronić swoje dane i zapewnić ciągłość działania w razie awarii. Szacuje się jednak, że ponad 72% przedsiębiorstw nie są w stanie sprostać oczekiwaniom dotyczącym odzyskiwania systemów informatycznych w zakresie celów punktu odzyskiwania (RPO) i celów związanych z czasem odzyskiwania (RTO).
Aby pomóc Ci w stworzeniu skutecznego planu odzyskiwania, konieczne jest pełne zrozumienie pojęć RTO i RPO oraz poznanie różnic między nimi. W tym poście wyjaśniono wszystko, co należy wiedzieć o tych dwóch parametrach, aby opracować niezawodną strategię odzyskiwania awaryjnego po awarii. Zapoznaj się z tekstem, aby dowiedzieć się, jak osiągnąć bardziej rygorystyczne wartości RPO i RTO, aby zminimalizować utratę danych i jak najszybciej wznowić normalną działalność biznesową po awarii.
Czym jest RTO?
Cele związane z czasem odzyskiwania (RTO) odnosi się do maksymalnego czasu przestoju, jaki organizacja może tolerować po wystąpieniu zdarzenia zakłócającego. Innymi słowy, RTO to czas między wystąpieniem awarii a przywróceniem dotkniętych nią krytycznych obciążeń.
Obliczenie RTO zależy zazwyczaj od plan odzyskiwania awaryjnego, dostępnych zasobów i budżetu. Gdy infrastruktura IT jest niedostępna, potrzebujesz czasu na zidentyfikowanie przyczyny (przyczyn) awarii i podjęcie niezbędnych działań w celu jej usunięcia. Należy jednak wdrożyć procedury odzyskiwania awaryjnego, aby zapewnić dostępność krytycznych systemów i obciążeń w trakcie rozwiązywania problemu produkcyjnego. RTO to czas między awarią a przywróceniem dostępności systemów dzięki kopii zapasowej lub replikacji obciążeń.
Czym jest RPO?
Cel punktu odzyskiwania (RPO) to maksymalna ilość danych, której utratę organizacja może znieść w przypadku awarii bez poważnych konsekwencji. Wskaźnik ten mierzy się w godzinach/minutach od ostatniego procesu wykonania kopii zapasowej/replikacji. Służy on do określenia, jak często należy wykonywać kopie zapasowe i repliki danych, aby zminimalizować utratę danych w wyniku zdarzenia zakłócającego.
W idealnej sytuacji zadanie tworzenia kopii zapasowej lub replikacji zostaje zakończone tuż przed awarią oryginalnej maszyny. Jednak w rzeczywistości zdarza się to rzadko, więc między momentem utworzenia ostatniej udanej kopii zapasowej a momentem awarii oryginalnej maszyny występuje luka. W tym czasie maszyna wirtualna wykonywała operacje i przechowywała dane, które najprawdopodobniej zostaną utracone.
Czym są RTO i RPO w odzyskiwaniu awaryjnym
Ostateczny cel ochrony danych jest jasny: Chcesz mieć pewność, że w razie awarii nie dojdzie do utraty krytycznych danych oraz że będziesz w stanie spełnić wymagania umów SLA swojej organizacji w zakresie czasu sprawności i dostępności. Jednakże odzwierciedlanie wszystkich zmian w środowisku wirtualnym w czasie rzeczywistym w lokalizacji przeznaczonej do odzyskiwania awaryjnego po awarii (Odzyskiwanie awaryjne) wiąże się ze znacznymi kosztami. Dlatego musisz pogodzić się z faktem, że w razie awarii utracisz część danych, a świadczenie usług IT ulegnie przerwaniu. Twoim zadaniem jest zatem zminimalizowanie tych strat i przerw.
Zilustrujmy pojęcia RPO i RTO na prostym schemacie:
Schemat przedstawia typowy scenariusz: maszyna wirtualna ulega awarii z jakiegoś powodu. Żółta linia reprezentuje RPO, czyli czas między ostatnią kopią zapasową a wystąpieniem awarii. Pomarańczowa linia to RTO i odzwierciedla czas potrzebny do przywrócenia maszyny wirtualnej.
Różnice między RTO a RPO
Aby zrozumieć, jak określić RTO i RPO, należy przyjrzeć się różnicom między nimi oraz ich roli w procesie DR.
Ocena
- RTO dotyczy przede wszystkim okresu, w którym oczekuje się wznowienia działalności biznesowej w przypadku awarii. Należy wziąć pod uwagę następujące kwestie:
- Oceń potrzeby i priorytety swojej organizacji, ponieważ są one unikalne dla każdej organizacji.
- Zastanów się, które aplikacje są najbardziej krytyczne dla usług i aplikacji niezbędnych do przetrwania organizacji, a także jakie mogą być konsekwencje awarii tych aplikacji.
- Określ kolejność, w jakiej należy przywrócić każdy system/aplikację, aby zapewnić skuteczne odzyskiwanie awaryjne przy minimalnych stratach wynikających z przestoju.
- RPO koncentruje się bardziej na ilości danych, które mogą zostać utracone podczas przestoju bez powodowania poważnych szkód dla wyników finansowych organizacji. Kwestie, które należy wziąć pod uwagę, to:
- Określ częstotliwość wykonywania kopii zapasowej/replikacji oraz ilość danych, które mogą zostać utracone między ostatnią kopią zapasową maszyny wirtualnej a faktyczną awarią.
- Weź pod uwagę ilość danych, na utratę których Twoja organizacja może sobie pozwolić dla każdego rodzaju obciążenia.
Koszty
Główna różnica między RTO a RPO polega na tym, że ten pierwszy uwzględnia wszystkie aspekty struktury biznesowej i procesu DR jako całości, podczas gdy ten drugi bierze pod uwagę jedynie krytyczność danych i aplikacji dla ciągłości działania. Dlatego też dotrzymanie wartości RTO może być wymagającym i kosztownym zadaniem, mającym na celu zapewnienie szybkiego odzyskiwania danych. Podobnie, krótsze wartości RPO oznaczają konieczność wykonywania większej liczby kopii zapasowych i tworzenia dodatkowych punktów odzyskiwania, co może zwiększyć koszty przechowywania danych.
Automatyzacja
- Ponieważ RPO koncentruje się na danych i odporności systemu na utratę, zaleca się częste wykonywanie kopii zapasowych danych. Wiele nowoczesnych rozwiązań do tworzenia kopii zapasowej pozwala na automatyczne Kopie zapasowe maszyn wirtualnych, co oznacza, że strategie tworzenia kopii zapasowej można dostosować w taki sposób, aby skutecznie realizowały cele RPO przy minimalnym nakładzie pracy z Państwa strony.
- Osiągnięcie RTO jest procesem bardziej złożonym w zarządzaniu, ponieważ uwzględnia wszystkie procesy biznesowe i komponenty systemu, które muszą zostać przywrócone podczas zdarzenia DR. Mimo to zaleca się zautomatyzowanie i orkiestrację całego procesu DR od początku do końca, aby zapewnić osiągnięcie celów RTO.
Łatwość obliczeń
- Wskaźnik RPO jest łatwy do obliczenia, ponieważ obejmuje tylko jeden aspekt procesu odzyskiwania – dane.
- RTO uwzględnia wszystkie aspekty organizacji, w tym znaczenie danych i usług, koszt przestoju, inwestycje w działania związane z odzyskiwaniem danych po awarii itp. Przy obliczaniu RTO należy wziąć pod uwagę różne rodzaje obciążeń i aplikacji, ponieważ mogą one wymagać różnych procesów odzyskiwania. Zaleca się obliczanie RTO na podstawie planu ciągłości działania, który określa potencjalne ryzyka i zagrożenia dla działalności oraz opisuje kroki, jakie należy podjąć w celu wznowienia działalności.
Aby zdefiniować RTO mające zastosowanie do różnych obciążeń w Państwa organizacji, proszę odpowiedzieć na następujące pytanie:
Jak długo konkretna aplikacja/system/maszyna może pozostawać wyłączona bez znaczącego wpływu na podstawową działalność Państwa organizacji?
Po udzieleniu odpowiedzi na to pytanie dla różnych maszyn, proszę rozważyć, czy oczekiwane wyniki mogą zaspokoić Państwa aktualne potrzeby biznesowe. Jeśli nie, proszę zastanowić się, w jaki sposób można ulepszyć proces wykonywania kopii zapasowych i Strategie DR w celu utrzymania jak największej aktualności danych kopii zapasowych.
Jak osiągnąć krótsze RPO i RTO dzięki NAKIVO
NAKIVO Backup & Replication pozwala wykonywać kopie zapasowe maszyn wirtualnych i fizycznych częściej, poprawiając RPO. Wystarczy zaplanować regularne kopie zapasowe w odstępach nieprzekraczających wyznaczonego celu. Rozwiązanie to pomaga również skrócić czas RTO dzięki natychmiastowemu odzyskiwaniu maszyny wirtualnej oraz usługom funkcja replikacji dla VMware vSphere, Microsoft Hyper-V i Amazon EC2. Zintegruj swoje usługi monitorowania sieci i uruchom proces odzyskiwania natychmiast po utracie dostępności maszyny wirtualnej. Można również tworzyć zdalne repliki (dokładne kopie) krytycznych maszyn wirtualnych. W przypadku awarii oryginalnej maszyny wirtualnej repliki zostaną automatycznie uruchomione. Jeśli utrzymanie replik wymaga więcej zasobów, niż można sobie pozwolić, można wybrać opcję funkcja natychmiastowego uruchamiania maszyn wirtualnych z kopii zapasowej.
Aby osiągnąć najkrótsze czasy RTO, firma NAKIVO Backup & Replication wprowadziła rozwiązanie Funkcje orkestracji odzyskiwania lokacji. W pełni zautomatyzuj Tryb failover i powrót po awarii dla różnych Scenariusze DR oraz przeprowadzaj testy bezprzerwowe, aby zapewnić odzyskiwanie danych w oczekiwanym czasie.
