Wdrażanie replikacji na potrzeby odzyskiwania awaryjnego: kompletny przewodnik
W dzisiejszych czasach klienci nie mają cierpliwości do jakichkolwiek przerw w świadczeniu usług, niezależnie od przyczyny. Na przykład, jeśli odwiedzasz stronę internetową firmy A w poszukiwaniu konkretnej usługi, a usługa ta jest niedostępna, prawdopodobnie przejdziesz na stronę konkurenta firmy A, który może zapewnić Ci potrzebne usługi. W dzisiejszym gorączkowym świecie znaczne przestoje w działalności mogą w dużym stopniu zaszkodzić lojalności klientów.
Innymi słowy, przestoje mogą skutkować:
- Utratą zysków
- Zniszczeniem wizerunku marki
- Problemami w relacjach z klientami i partnerami
- Problemami z łańcuchem dostaw
- Problemami prawnymi itp.
Skutki te mogą wynikać z braku dostępności usług i danych o znaczeniu krytycznym dla działalności, a właśnie temu służy replikacja — pomaga całkowicie uniknąć przestojów lub przynajmniej zminimalizować ich skutki. Odzyskiwanie awaryjne (DR) to znacznie więcej niż tylko replikacja na potrzeby odzyskiwania awaryjnego, a replikacja, podobnie, jest wykonywana nie tylko w celu odzyskiwania awaryjnego, ale także w celu synchronizacji, integracji, konsolidacji i migracji danych.
Aby przywrócić infrastrukturę IT lub przynajmniej jej najbardziej krytyczne elementy po wystąpieniu awarii, Twoja organizacja potrzebuje alternatywnej lokalizacji, w której przechowywane są zreplikowane dane i która może służyć jako miejsce w Trybie failover w razie awarii. Alternatywna lokalizacja jest niezbędna do odzyskiwania sprawności po awariach zagrażających funkcjonowaniu głównej lokalizacji, a nawet jej fizycznemu istnieniu. Replikacja na potrzeby odzyskiwania awaryjnego polega na tworzeniu dokładnych kopii danych, zarówno w obrębie jednej lokalizacji, jak i pomiędzy lokalizacją główną a lokalizacją (lub lokalizacjami) alternatywną. Replikacja na potrzeby odzyskiwania awaryjnego powinna być stała i ciągła, ponieważ w razie awarii konieczne jest przełączenie najnowszych procesów IT o znaczeniu krytycznym dla działalności na oprogramowanie i sprzęt do odzyskiwania awaryjnego w akceptowalnym czasie.
Chociaż obecnie coraz większą popularność zyskuje replikacja w chmurze, korzystanie z alternatywnych lokalizacji fizycznych pozostaje bardzo powszechne. Dwa główne typy lokalizacji fizycznych to lokalizacja aktywna (hot site) i lokalizacja rezerwowa (cold site). Lokalizacja typu hot site jest kopią głównego centrum danych, zawierającą ten sam sprzęt, oprogramowanie i infrastrukturę, więc jeśli główna lokalizacja nie działa, lokalizacja typu hot site może natychmiast stać się punktem w Trybie failover. Jak można sobie wyobrazić, jej koszt jest odpowiednio wysoki. Z drugiej strony lokalizacja typu cold site to po prostu przestrzeń bez zainstalowanego sprzętu i oprogramowania, która jednak zawiera niezbędne linie zasilające i komunikacyjne.
Czynniki zagrażające ciągłości działania firmy i wymagające odzyskiwania awaryjnego po awarii
Istnieje mnóstwo czynników zagrażających infrastrukturze IT organizacji i jej ciągłości działania. Niektóre z nich są łagodne i stosunkowo częste (nieplanowane przestoje w segmentach infrastruktury), a inne mają charakter katastrofalny, jednak słuszne jest traktowanie ich wszystkich jako awarii o różnym stopniu dotkliwości. Spróbujmy je ogólnie sklasyfikować:
- Klęski żywiołowe. Są to zdarzenia losowe, nad którymi nikt nie ma kontroli. Niezależnie od tego, czy są przewidywalne, czy nie, mają one ogromny wpływ, siejąc spustoszenie i zniszczenie na swojej drodze — drodze, na której może znajdować się fizyczna lokalizacja Twojej organizacji. Powodzie, huragany, erupcje wulkanów, tornada i trzęsienia ziemi mogą nie stanowić czynnika ryzyka w Twoim regionie, ale ekstremalne warunki pogodowe są zagrożeniem wszędzie. Zagrożenia związane z cywilizacją pojawiają się i znikają; musimy zawsze podejmować środki ostrożności, aby uniknąć najgorszych skutków katastrof naturalnych.
- Katastrofy spowodowane przez człowieka obejmują akty sabotażu, terroryzm, szpiegostwo przemysłowe, wandalizm itp. Wśród tych zagrożeń znajdują się również zaniedbania i nieumyślne błędy.
- Wydarzenia krajowe i międzynarodowe takie jak wojny, strajki i inne przejawy niestabilnej sytuacji politycznej mogą doprowadzić do całkowitego zniszczenia fizycznej siedziby Twojej organizacji.
- Awarie i zagrożenia związane z technologią i oprogramowaniem obejmują przerwy w dostawie prądu, usterki sprzętu i utratę danych, a także czynniki o złośliwym charakterze, takie jak wirusy, oprogramowanie wymuszające okup i cyberataki.
W dzisiejszym świecie infrastruktury IT stają się coraz bardziej powszechnie wirtualizowane, co przyczyniło się do ogólnej skuteczności odzyskiwania awaryjnego. Dlatego współczesne oprogramowanie do replikacji w ramach odzyskiwania awaryjnego jest bardziej skuteczne i przystępne cenowo niż kiedykolwiek, umożliwiając tworzenie i orkiestrację w pełni zautomatyzowanych procesów odzyskiwania awaryjnego oraz osiąganie akceptowalnych wartości RTO i RPO.
Wśród wskaźników DR, podczas konfiguracji replikacji należy wziąć pod uwagę następujące elementy:
- cele związane z czasem odzyskiwania (RTO)służy do pomiaru, jak długo może trwać proces odzyskiwania danych, lub innymi słowy, ile czasu można stracić, zanim organizacja wznowi świadczenie usług.
- cele punktu odzyskiwania (RPO) (RPO)odnosi się do tego, jak aktualne muszą być pliki, które należy odzyskać. Jeśli aplikacje o znaczeniu krytycznym są bardzo dynamiczne i zachodzi w nich wiele transakcji, wówczas konieczne jest ich natychmiastowe odzyskiwanie. W przeciwnym razie istnieje ryzyko utraty wielu transakcji, a co za tym idzie – utraty zysków, które miały one wygenerować.
- Czas odzyskiwania pracy (WRT) wskazuje, ile czasu powinno zająć firmie zweryfikowanie integralności przywróconych danych.
- Maksymalny dopuszczalny czas przestoju (MTD) mierzy, ile czasu firma może przeznaczyć na odzyskiwanie awaryjne bez ponoszenia poważnych strat i niekorzystnych konsekwencji.
Poniżej znajduje się zestaw cech replikacji, które należy wziąć pod uwagę przy wyborze rozwiązania do replikacji w celu odzyskiwania awaryjnego dla swojej organizacji.
Replikacja synchroniczna i asynchroniczna
Podczas replikacji synchronicznej dane są zapisywane do docelowego obiektu danych, jednocześnie z zapisywaniem ich do odpowiedniego źródła, co pozwala osiągnąć najniższe możliwe cele RTO i RPO. Ten rodzaj replikacji służącej do odzyskiwania danych po awarii jest preferowany w przypadku zaawansowanych aplikacji transakcyjnych oraz klastrów o wysokiej dostępności, wymagających natychmiastowego Trybu failover. Klient oprogramowania, który zapisuje dane, otrzymuje potwierdzenie zapisu dopiero po zatwierdzeniu danych zarówno w pamięci głównej, jak i pomocniczej.
Chociaż obiekt i jego replika są utrzymywane w synchronizacji, powoduje to opóźnienia i spowolnienie synchronizowanej aplikacji, zajmując przepustowość i generując ogólne obciążenie. Jeśli używana jest alternatywna lokalizacja magazynu, istnieje również możliwość jej odłączenia. Jednak replikacja synchroniczna pozwala na niemal natychmiastowe przełączenie awaryjne do lokalizacji pomocniczej bez utraty danych.
Podczas replikacji asynchronicznej , dane są zapisywane do docelowego obiektu danych dopiero po pewnym czasie od ich zapisania w odpowiednim źródle. Replikacja danych w ramach odzyskiwania awaryjnego odbywa się w ustalonych odstępach czasu (raz na minutę, co dziesięć minut, co godzinę itp.), zgodnie z ustalonym harmonogramem. Jest to dobry wybór, jeśli przepustowość sieci nie jest w stanie sprostać obciążeniu związanemu z replikacją synchroniczną, to znaczy jeśli tempo zmian danych o znaczeniu krytycznym stale przewyższa tempo ich przesyłania do lokalizacji trybu failover.
Replikacja oparta na plikach i blokach
System plików przechowuje pliki w określonych blokach dyskowych. Jeden plik może być przechowywany w blokach rozrzuconych po całym dysku. Dlatego podczas odczytu pliku w procesie replikacji opartej na plikach system musi „biegać” po dysku, aby znaleźć rozrzucone fragmenty odczytywanego pliku. To „bieganie” zajmuje sporo czasu. Straty czasu można uniknąć dzięki replikacji opartej na blokach, która do lokalizacji docelowej przesyła nie zmienione pliki, ale zmienione bloki, odczytując je w kolejności, w jakiej znajdują się na dysku. Dlatego przy pozostałych warunkach niezmienionych lepiej jest wybrać rozwiązanie DR o wysokiej wydajności w zakresie replikacji blokowej.
Replikacja pełna i replikacja przyrostowa
Ciągła replikacja całego woluminu danych jest nieuzasadniona i niepraktyczna. Jednak na początku należy przeprowadzić jedną replikację pełną. W wyniku tej replikacji pełnej tworzona jest dokładna replika obiektu źródłowego. Następnie można rozpocząć replikację przyrostową, co oznacza, że do Trybu failover kopiowane są tylko zmiany danych (zmiany na poziomie bloków, jeśli stosowana jest replikacja blokowa). Obecnie wszystkie zaawansowane rozwiązania typu „ Rozwiązania DR”, takie jak NAKIVO Backup & Replication, umożliwiają przeprowadzanie przyrostowej replikacji na potrzeby odzyskiwania awaryjnego.
Replikacja spójna z aplikacją
Jeśli replikacja na potrzeby odzyskiwania awaryjnego jest spójna z aplikacją, rejestruje ona stan danych aplikacji przechowywanych w pamięci oraz operacji wejścia/wyjścia. Pozwala to uniknąć utraty danych w aplikacji. Replikowane aplikacje zachowują spójność transakcyjną, co oznacza, że nie ulegną awarii podczas uruchamiania w lokalizacji odzyskiwania awaryjnego.
Replikacja odzyskiwania awaryjnego z wykorzystaniem NAKIVO Backup & Replication
Jeśli szukasz najlepsze rozwiązanie do tworzenia kopii zapasowej VMware dla swojego środowiska, wypróbuj NAKIVO Backup & Replication. Nasze bezagentowe rozwiązanie do ochrony danych zapewnia oparte na obrazach, spójne z aplikacją przyrostowe tworzenie kopii zapasowych oraz replikacja maszyn wirtualnych VMware, a także maszyny wirtualne Hyper-V i instancje AWS EC2. Jak wspomniano powyżej, zamierzamy zademonstrować, jak przeprowadzić replikację maszyn wirtualnych na przykładzie maszyn wirtualnych VMware. W przypadku środowisk wirtualnych VMware replikacja w NAKIVO Backup & Replication posiada następujące funkcje (wiele z nich jest dostępnych dla Microsoft Hyper-V i AWS EC2):
- Tryb spójności z aplikacją Zapewnia, że Microsoft Exchange, Microsoft Active Directory, Microsoft SQL i niektóre inne aplikacje zapisują dane z pamięci oraz transakcje wejścia/wyjścia na dysk przed rozpoczęciem replikacji na potrzeby odzyskiwania awaryjnego. Aplikacje replikowane w tym trybie są niespójne po awarii, co oznacza, że mogą działać bezbłędnie, jeśli dojdzie do awarii i konieczne będzie uruchomienie replik.
- Wygodne automatyzacja replikacji za pomocą zasad . Dzięki zasadom można całkowicie zautomatyzować replikację maszyn wirtualnych. Zasada składa się z reguł opartych na rozmiarze maszyny wirtualnej, tagu, nazwie, lokalizacji itp. Zadanie oparte na zasadach działa ze wszystkimi maszynami wirtualnymi odpowiadającymi ustawionym regułom, automatycznie wyszukuje te maszyny wirtualne w miarę ich pojawiania się w infrastrukturze i dodaje je do zadań replikacji.
- Przechowywanie punktów odzyskiwania jest elastyczne , co pozwala na posiadanie 30 punktów odzyskiwania, znanych jako migawki maszyn wirtualnych. Korzystając ze schematu rotacji „dziadek-ojciec-syn”, można tworzyć codzienne, tygodniowe, miesięczne i roczne punkty odzyskiwania.
- Funkcja Weryfikacja zrzutu ekranupozwala sprawdzić, czy repliki są w stanie operacyjnym. Dzięki tej funkcji, jeśli dojdzie do awarii, nie spotkają Cię „miłe” niespodzianki, takie jak uszkodzone i pełne błędów repliki maszyn wirtualnych.
- W przypadku danych o niewymagających RTO, czyli danych replikowanych asynchronicznie, można replikować nie maszyny wirtualne produkcyjne, ale ich kopie zapasowe . Pomaga to odciążyć główne zasoby IT.
- W przypadku replik maszyn wirtualnych można zdecydować się na utworzenie dysków z alokacją dynamiczną , niezależnie od tego, jakich dysków używają maszyny wirtualne w środowisku produkcyjnym. Jeśli dysk jest alokowany dynamicznie, zajmuje tylko tyle miejsca, ile zajmują dane i aplikacje, i nie zawiera niewykorzystanej przestrzeni.
- Funkcja replikacji naszego produktu może być wykorzystywana w ramach funkcji Odzyskiwanie lokacji , która pozwala na orkiestrację i automatyzację złożonych procesów odzyskiwania po awarii. Dzięki funkcji Odzyskiwanie lokacji można zintegrować replikację, planowane lub awaryjne Tryb failover, powrót po awarii i inne operacje w jeden proces, który można uruchomić jednym kliknięciem!
- Dane wymiany — pliki wymiany (w systemie Windows) i partycje wymiany (w systemie Linux) — można wykluczyć z replik maszyn wirtualnych, co zwiększa prędkość replikacji i oszczędza miejsce na dysku.
LAN-Free Data TransferTryb ten znacznie przyspiesza replikację poprzezHot AddiDirect SAN AccessJeśli NAKIVO Backup & Replication działa na serwerze z dostępem do magazynów danych maszyn wirtualnych, może, dzięki funkcjiHot Add, odczytywać dane maszyn wirtualnych z tych magazynów poprzez stos wejścia/wyjścia pamięci masowej, omijając przy tym stos TCP/IP hosta. Z kolei funkcjaDirect SAN Accesspozwala na odczyt danych bezpośrednio z pamięci masowej SAN za pośrednictwem interfejsu Fibre Channel lub iSCSI, co zwiększa prędkość replikacji i odciąża sieć produkcyjną.- Jeśli korzystasz z Microsoft Exchange lub Microsoft SQL Server, NAKIVO Backup & Replication może skrócić dzienniki transakcji serwera , tak aby nie zajmowały zbyt dużo miejsca na serwerze.
- Dzięki funkcji Przyspieszenie sieci możesz zwiększyć prędkość replikacji nawet dwukrotnie. Aby skorzystać z tej funkcji, wystarczy zainstalować dodatkowy Transporter na miejscu lub zdalnie.
- Zainstalowanie dodatkowego Transportera pozwala również na szyfrowanie replikowanych danych podczas ich przesyłania oraz po dotarciu do docelowego repozytorium.
- Dzięki funkcji Wielodostępność , która umożliwia świadczenie usługi Replication-as-a-Service, można utworzyć do 100 izolowanych dzierżawców, a klienci mogą z nich korzystać do wykonywania replikacji i innych zadań według własnego uznania.
- Zaawansowana funkcja ograniczenia przepustowości pozwala ograniczyć przepustowość dla procesów replikacji, tak aby nie przeciążały sieci.
- Jeśli zajdzie potrzeba zaoszczędzenia czasu i odciążenia sieci, można najpierw przenieść ( seed ) replikę maszyny wirtualnej na nośnik wymienny, a następnie przenieść ją w nowe miejsce. Po tym wystarczy tylko replikacja przyrostowa. NAKIVO Backup & Replication może wykorzystywać wbudowaną, autorską funkcję śledzenia zmienionych bloków (Changed Block Tracking) oraz funkcję Changed Block Tracking firmy VMware do wykonywania przyrostowej replikacji maszyn wirtualnych (tworzenia kopii zapasowych).
- Można zainstalować NAKIVO Backup & Replication na urządzeniach NAS i replikować dane między nimi, ciesząc się zwiększoną wydajnością i szybkością.
Jak utworzyć zadanie replikacji VMware w NAKIVO Backup & Replication
Poniżej pokażemy, jak utworzyć zadanie replikacji maszyny wirtualnej dla środowiska VMware w NAKIVO Backup & Replication . Proces jest prosty i intuicyjny, o czym można się przekonać na własne oczy.
W głównym interfejsie użytkownika NAKIVO Backup & Replication kliknijCreate, a następnie wybierzVMware vSphere replication job (w zależności od środowiska można również wybraćAmazon EC2 replication joblub zadanie replikacji Microsoft Hyper-V ).
Następnie wykonaj czynności opisane poniżej.
1. W krokuSourcew New Replication Job Wizard for VMware vSpherewybierz maszynę wirtualną lub cały kontener maszyn wirtualnych do replikacji i kliknijNext.

2. W krokuDestinationwybierz dla repliki kontener docelowy, magazyn danych docelowy oraz folder maszyn wirtualnych. Następnie kliknijNext.

3. W krokuNetworkswłącz i skonfiguruj mapowanie sieci, jeśli w lokalizacji docelowej (DR) maszyny wirtualne korzystają z innych sieci niż w lokalizacji głównej. Po wykonaniu tej czynności kliknijNext. Alternatywnie możesz pominąć ten krok i od razu kliknąćNext .

4. W krokuRe-IPmożesz skonfigurować procedurę zmiany adresów IP, jeśli maszyny wirtualne używają w lokalizacji docelowej (DR) innych adresów IP niż w lokalizacji głównej. Możesz utworzyć regułę zmiany adresów IP lub użyć istniejącej. Następnie kliknijNext. Możesz również pominąć ten krok, klikającNext od razu.

5. W krokuScheduleznajdziesz bardzo wygodny sposób planowania zadania replikacji. Możesz zaznaczyćDo not schedule, run on demand, jeśli jest to jednorazowe zadanie replikacji lub nie jesteś jeszcze pewien szczegółów harmonogramu. W sekcji S chedule #1możesz wybraćRun daily/weekly(czyli określone dni tygodnia), Run monthly/yearly (tj. określone miesiące w roku),Run periodicallylubRun after another job. Jeśli wybierzeszRun after another job, powinieneś wybrać, na przykład, zadanie Z i skonfigurować, czy chcesz, aby bieżące zadanie uruchamiało się po Z natychmiast, czy nie, oraz czy powinno uruchamiaćAfter successful runs,After failed runslubAfter stopped runs. Możesz również dodać kolejny harmonogram(#2, #3 itp.) oraz wyświetlić Kalendarz dla własnej wygody. Inną opcją konfiguracji jestEffective from, która określa dzień, w którym harmonogram zadania replikacji staje się aktywny.
Upewnij się, że interwał replikacji jest zgodny z maksymalnym RPO dla replikowanej maszyny wirtualnej.

6. Na etapieRetentionmożna skonfigurować do 30 punktów odzyskiwania do zachowania (po zakończeniu zadania replikacji NAKIVO Backup & Replication powinien utworzyć punkt odzyskiwania replikowanej maszyny wirtualnej). Dzięki NAKIVO Backup & Replication można korzystać z tradycyjnego schematu przechowywania danych typu „dziadek-ojciec-syn”, który z punktu widzenia odzyskiwania po awarii (DR) idealnie nadaje się do przechowywania replik i kopii zapasowych.

7. W krokuOptionsmożna ustawić wszystkie pozostałe opcje, maksymalnie automatyzując zadanie replikacji i dostosowując je do konkretnych potrzeb. Można nadać nazwę zadaniu replikacji i ustawić je w trybie spójnym z aplikacją, śledzenie zmian, przyspieszenie sieci, szyfrowanie, weryfikacja maszyn wirtualnych, typ dysku używanego dla repliki (dysk typu thin lub ten używany przez replikowaną maszynę wirtualną), obcinanie dziennika, użycie skryptów, tryb transportu, ograniczenie przepustowości itp.

8. Po skonfigurowaniu wszystkich ustawień należy kliknąćFinish lubFinish & Run(jeśli zadanie ma zostać uruchomione natychmiast). Po utworzeniu repliki jest ona gotowa do wykorzystania w procesie DR.
Jak utworzyć zadanie Odzyskiwania lokacji przy użyciu NAKIVO Backup & Replication
Utworzone właśnie zadanie replikacji może stanowić część złożonego, zautomatyzowanego przepływu pracy DR, który jest możliwy dzięki funkcjiSite Recovery. Za pomocą tej funkcji można organizować działania i warunki w kompleksowe algorytmy DR dostosowane do określonych sytuacji i celów (np. awaria zasilania, zapobieganie katastrofom itp.).
Oto jak zintegrować zadanie replikacji z procesem odzyskiwania po awarii za pomocą funkcji Site Recovery :
1. W głównym interfejsie użytkownika NAKIVO Backup & Replication kliknijCreate, a następnie wybierzSite recovery job.

2. Otworzy się New Site Recovery Job Wizard . W krokuActionskreatora wybierzRun jobs.

3. Zobaczysz oknoRun Jobs, w którym możesz wybrać zadania replikacji, w tym właśnie utworzone. Po wybraniu zadania i skonfigurowaniu go kliknijSave.

4. Ponownie otworzy się krokActions. W tym kroku możesz teraz wybrać dodatkowe działania do uwzględnienia w złożonym przepływie pracy odzyskiwania awaryjnego lub kliknąćNext. Następnie postępuj zgodnie z instrukcjami New Site Recovery Job Wizard, aż utworzysz zadanie odzyskiwania lokacji.
Podsumowanie
Nasz produkt pozwala zabezpieczyć Państwa środowisko wirtualne przed nieplanowanymi przestojami i katastrofami dzięki opcjom replikacji na potrzeby odzyskiwania awaryjnego oraz wykonania kopii zapasowej, które są zarówno oparte na blokach, jak i spójne z aplikacją. Dzięki zasadom opartym na regułach można zautomatyzować i orkiestrować procesy replikacji na potrzeby odzyskiwania awaryjnego, integrując je ze złożonymi, kompleksowymi przepływami pracy. Można przyspieszyć zadania replikacji dzięki funkcji przyspieszenia sieci i śledzenia zmian oraz zapewnić, poprzez weryfikację maszyn wirtualnych, że repliki są w stanie gotowości operacyjnej. Funkcja i cena NAKIVO Backup & Replication należą do najlepszych na rynku.
Aby przekonać się o tym na własnej skórze i przetestować NAKIVO Backup & Replication w środowisku fizycznym, wirtualnym lub w chmurze, pobierz w pełni funkcjonalną bezpłatną wersję próbną już dziś!
