Najlepsze rozwiązania dotyczące odzyskiwania awaryjnego w środowisku VMware
Odzyskiwanie awaryjne to proces obejmujący zestaw działań mających na celu przywrócenie elementów infrastruktury po wystąpieniu awarii. Ponadto celem odzyskiwania awaryjnego jest zminimalizowanie negatywnych skutków, jakie może spowodować awaria, a także zapewnienie ciągłości działania. Aby przygotować się na ewentualne rodzaje awarii, firmy zazwyczaj opracowują plan odzyskiwania awaryjnego, który powinien stanowić część planu ciągłości działania.
Maszyny wirtualne są komponentami narażonymi na ryzyko w przypadku awarii; właśnie z tego powodu należy przygotować się na awarię, opracowując plan odzyskiwania awaryjnego. W tym wpisie na blogu omówiono najlepsze rozwiązania dotyczące odzyskiwania awaryjnego (DR) w środowisku wirtualnym VMware.
Opracowanie planu odzyskiwania awaryjnego
Plan odzyskiwania awaryjnego ( plan odzyskiwania awaryjnego ) to uporządkowany dokument opisujący proces odzyskiwania awaryjnego jako zbiór działań, które powinny zostać podjęte przez odpowiednie osoby w sytuacji awaryjnej. Ponadto dokument ten określa kryteria decydujące o konieczności uruchomienia planu. Przyczyną awarii mogą być zarówno czynniki naturalne, jak i spowodowane przez człowieka. Plan DR powinien zawierać różne scenariusze odzyskiwania dla różnych rodzajów katastrof i nieplanowanych zdarzeń. Na przykład plan DR może opisywać, co należy zrobić w przypadku ataku oprogramowania wymuszającego okup, awarii zasilania, awarii sprzętu, trzęsienia ziemi, tajfunu itp. Plan DR można podzielić na sekcje: na przykład pierwsza sekcja mogłaby wyjaśniać odzyskiwanie sieci, druga mogłaby skupiać się na odzyskiwaniu centrum danych, a trzecia wyjaśniałaby odzyskiwanie maszyn wirtualnych itp.
Przygotuj swoją lokalizację odzyskiwania awaryjnego
Lokalizacja odzyskiwania awaryjnego po awarii to miejsce, które firma może wykorzystać do przywrócenia infrastruktury i obciążeń, gdy główna lokalizacja używana do celów produkcyjnych przestaje działać. Lokalizacje odzyskiwania awaryjnego mogą być typu hot, warm lub cold.
- Lokalizacja typu hot to w pełni funkcjonalna lokalizacja odzyskiwania awaryjnego, wyposażona w skonfigurowane serwery ESXi, pamięć masową, repliki maszyn wirtualnych i dane użytkowników. Jeśli główna lokalizacja ulegnie awarii w wyniku katastrofy, lokalizacja typu hot jest gotowa do natychmiastowego użycia. Wdrażanie lokalizacji typu hot jest kosztowne, ale zapewnia możliwość najszybszego możliwego odzyskania.
- Lokalizacja typu warm zawiera pewien sprzęt, taki jak urządzenia sieciowe, serwery bramy, hosty ESXi, a także pamięć masową, ale może nie zawierać maszyn wirtualnych i danych użytkowników. W tym przypadku maszyny wirtualne należy odzyskać z kopii zapasowych, a dane użytkowników mogą również wymagać skopiowania. Dodatkowy sprzęt i oprogramowanie można zainstalować podczas procesu odzyskiwania awaryjnego, dlatego korzystanie z ciepłej lokalizacji jest rozwiązaniem kompromisowym, które wiąże się ze średnimi kosztami, ale zapewnia przystępny czas odzyskiwania.
- Zimna lokalizacja to lokalizacja DR, która posiada jedynie podstawową infrastrukturę. W przypadku wystąpienia awarii serwery muszą zostać skonfigurowane, należy przeprowadzić wdrażanie pamięci masowej, przywrócić maszyny wirtualne, a dane użytkowników mogą wymagać wyodrębnienia z kopii zapasowych. Korzystanie z tego typu lokalizacji DR wymaga większego nakładu pracy w celu odzyskiwania maszyn wirtualnych i obciążeń. Ten proces odzyskiwania trwa długo, ale koszt posiadania serwisu zapasowego typu „cold site” jest najniższy w porównaniu z innymi typami serwisów.
Automatyczne tworzenie kopii zapasowych i replik
Kopie zapasowe i repliki maszyn wirtualnych są najważniejszymi elementami odzyskiwania awaryjnego w środowisku wirtualnym VMware vSphere. Kopia zapasowa obejmuje kopię danych maszyny wirtualnej, która jest przechowywana w bezpiecznym miejscu. Zarchiwizowane dane mogą być skompresowane, a ich odzyskanie wymaga czasu. Replika maszyny wirtualnej to identyczna kopia maszyny źródłowej, która znajduje się na Host ESXi, jest gotowa do uruchomienia w razie potrzeby i jest używana podczas Tryb failover. Należy unikać zbyt częstego ręcznego wykonywania kopii zapasowych maszyn wirtualnych, ponieważ w razie awarii niektóre ważne zmiany mogą zostać pominięte i utracone. Należy korzystać z odpowiedniego oprogramowania do ochrony danych maszyn wirtualnych na poziomie hosta, które może automatycznie tworzyć kopie zapasowe i repliki maszyn wirtualnych po skonfigurowaniu harmonogramu.
Korzystaj z funkcji klastrowania VMware
VMware zapewnia funkcje klastrowania takie jak klaster Distributed Resource Scheduler (DRS), klaster High Availability (HA) oraz Fault Tolerance (dostępne dla maszyn wirtualnych w klastrze HA). Klaster HA pomaga zminimalizować przestoje maszyn wirtualnych, natomiast Fault Tolerance (FT) pozwala uniknąć przestojów maszyn wirtualnych w przypadku awarii sprzętu. Należy pamiętać, że funkcje klastrowania nie zastępują tworzenia kopii zapasowych i replikacji. Wysoka dostępność z odpornością na awarie oraz tworzenie kopii zapasowych z replikacją wzajemnie się uzupełniają. Chodzi o to, że HA i FT nie chronią danych przed uszkodzeniem, usunięciem plików wewnątrz maszyn wirtualnych, nieudanymi aktualizacjami oprogramowania lub innymi awariami oprogramowania itp.
Stosuj odpowiednią kolejność odzyskiwania maszyn wirtualnych
Maszyny wirtualne powinny być odzyskiwane w odpowiedniej kolejności. Wyobraź sobie, że masz wiele maszyn wirtualnych z różnymi aplikacjami, które są od siebie zależne. Klasycznym przykładem jest posiadanie maszyny wirtualnej z kontrolerem domeny Active Directory, maszyny wirtualnej z serwerem bazy danych oraz maszyny wirtualnej z serwerem WWW. Maszyny wirtualne muszą być uruchamiane w następującej kolejności:
- Najpierw należy uruchomić maszynę wirtualną z kontrolerem domeny.
- Maszyna wirtualna z serwerem bazy danych uruchamia się, gdy działa maszyna wirtualna z kontrolerem domeny, ponieważ serwer bazy danych używa kontrolera domeny do uwierzytelniania użytkowników.
- Maszyna wirtualna z serwerem WWW uruchamia się, gdy działa maszyna wirtualna z serwerem bazy danych, ponieważ w tym przypadku serwer WWW używa bazy danych do prawidłowego działania.
Jeśli masz maszynę wirtualną z serwerem pocztowym MS Exchange, musi ona uruchomić się po maszynie wirtualnej z kontrolerem domeny, ponieważ MS Exchange jest zintegrowany z Active Katalog do uwierzytelniania użytkowników.
Zastosuj odpowiednią konfigurację sieci maszyn wirtualnych
Lokalizacja produkcyjna i lokalizacja odzyskiwania awaryjnego mogą korzystać z różnych sieci do połączeń maszyn wirtualnych. Wirtualne karty sieciowe maszyn wirtualnych są podłączone do portów przełączników wirtualnych (vSwitches). Grupy portów reprezentują różne sieci z nazwami sieciowymi i odpowiednimi adresami. Jeśli przywracasz maszynę wirtualną do lokalizacji odzyskiwania po awarii, ale maszyna wirtualna jest skonfigurowana do łączenia się z siecią lokalizacji produkcyjnej (która różni się od sieci używanej dla maszyn wirtualnych w lokalizacji odzyskiwania po awarii), nie można nawiązać połączenia sieciowego maszyny wirtualnej. W takim przypadku nie zapomnij zmienić ustawień sieciowych maszyn wirtualnych podczas przywracania ich w lokalizacji odzyskiwania po awarii.
Przygotuj magazyn dla maszyn wirtualnych
W magazynie używanym w lokalizacji DR musi być wystarczająca ilość wolnego miejsca, aby pomieścić maszyny wirtualne. Jest to pierwszy i najważniejszy wymóg. Magazyn musi również zapewniać wystarczającą wydajność; w przeciwnym razie usługi o znaczeniu krytycznym dla działalności, które działają na maszynach wirtualnych, mogą działać z opóźnieniem. Jeśli używana jest pamięć masowa sieciowa, taka jak NAS (Network Attached Storage) lub SAN (Storage Area Network), prędkość sieci musi być wystarczająco duża, aby sprostać wymaganiom. Sieć magazynowa w lokalizacji DR musi być siecią dedykowaną, oddzieloną od innych sieci.
Regularnie testuj swój plan odzyskiwania awaryjnego
Plan odzyskiwania awaryjnego może wyglądać dobrze na papierze, ale może okazać się bezużyteczny w przypadku awarii, jeśli nie zostanie wcześniej przetestowany. Dlatego należy regularnie testować plan odzyskiwania awaryjnego. Testowanie pozwala sprawdzić, czy plan DR jest wykonalny oraz czy RTO i RPO mogą zostać spełnione. Testowanie pozwala również wykryć wady planu DR, a tym samym wprowadzić poprawki w celu ich usunięcia.
Regularnie testuj swój plan DR, aby upewnić się, że środowisko wirtualne vSphere może zostać przywrócone. Infrastruktura może ulegać zmianom wraz z upływem czasu, a po wprowadzeniu zmian plan DR, który niedawno był wykonalny, może już nie spełniać odpowiednich wymagań. Na przykład mogą zostać dodane maszyny wirtualne, zmienione adresy IP, aplikacje mogą zostać przeniesione z jednej maszyny wirtualnej na inną itp. Regularne testy pozwalają wykryć, które części planu należy zaktualizować po wprowadzeniu zmian w infrastrukturze, aby plan DR pozostał skuteczny.
Znajdź odpowiednie rozwiązanie do odzyskiwania lokacji
Po opracowaniu planu DR znajdź rozwiązanie do odzyskiwania lokacji, które najlepiej odpowiada Twoim potrzebom. W przypadku korzystania z VMware vSphere rozwiązanie powinno obsługiwać tworzenie kopii zapasowej i replikację maszyn wirtualnych na poziomie hosta, szybkie przywracanie z kopii zapasowej, Tryb failover na replikę maszyny wirtualnej, odzyskiwanie całej maszyny wirtualnej oraz odzyskiwanie poszczególnych obiektów. Należy wybrać odpowiednie rozwiązanie z odpowiednią funkcją, które umożliwi regularne testowanie i aktualizowanie planu odzyskiwania po awarii.
NAKIVO Backup & Replication dla odzyskiwania awaryjnego VMware
NAKIVO Backup & Replication to szybkie, niezawodne i niedrogie rozwiązanie do ochrony danych maszyn wirtualnych, które może chronić maszyny wirtualne VMware. Produkt ten umożliwia między innymi tworzenie kopii zapasowych i replikację maszyn wirtualnych na poziomie hosta, odzyskiwanie poszczególnych obiektów, natychmiastowe odzyskiwanie maszyn wirtualnych oraz Tryb failover na replikę maszyny wirtualnej. Nie ma potrzeby instalowania agentów na maszynach wirtualnych, ponieważ wykorzystywany jest interfejs VMware vStorage API do ochrony danych. Ponadto NAKIVO Backup & Replication zawiera nową funkcję Odzyskiwanie lokacji, dzięki której można przeprowadzić odzyskiwanie awaryjne całych lokalizacji z (nie tylko) maszynami wirtualnymi VMware.
Przegląd funkcji Odzyskiwanie lokacji
Odzyskiwanie lokacji to potężna funkcja, która pomaga odzyskać maszyny wirtualne z jednej lokalizacji do drugiej w przypadku awarii. Funkcja ta może być również wykorzystywana do planowanej migracji maszyn wirtualnych między lokalizacjami. Można tworzyć zautomatyzowane przepływy pracy związane z odzyskiwaniem i uruchamiać je w celu planowanego lub awaryjnego trybu failover, a także w celach testowych.
Funkcje odzyskiwania lokacji
Odzyskiwanie lokacji pozwala zautomatyzować i koordynować proces odzyskiwania maszyn wirtualnych po awarii. Funkcja ta obejmuje zestaw działań i warunków, które można połączyć w proces odzyskiwania (zadanie) zgodnie z planem odzyskiwania awaryjnego. Działania te to:
- Tryb failover maszyn wirtualnych. Można przełączyć się na replikę maszyny wirtualnej (replika musi zostać utworzona przed wykonaniem akcji przełączenia).
- Powrót po awarii maszyn wirtualnych . Można przenieść obciążenia z powrotem z repliki maszyny wirtualnej przechowywanej w lokalizacji odzyskiwania po awarii do maszyny źródłowej przechowywanej w lokalizacji produkcyjnej.
- Uruchom maszyny wirtualne . Można uruchomić jedną lub wiele maszyn wirtualnych.
- Zatrzymaj maszyny wirtualne . Można zatrzymać jedną lub wiele maszyn wirtualnych.
- Uruchom zadania . Można uruchomić zadania (tworzenie kopii zapasowej, replikacja, szybkie uruchomienie maszyny wirtualnej itp.) utworzone w instancji NAKIVO Backup & Replication.
- Zatrzymaj zadania . Można zatrzymać uruchomione zadania.
- Uruchom skrypt . Można uruchomić skrypt na komputerze z instancją NAKIVO Backup & Replication, na zdalnym komputerze z systemem Windows, zdalnym komputerze z systemem Linux, maszynie wirtualnej VMware, maszynie wirtualnej Hyper-V lub instancji EC2.
- Podłącz repozytorium . Można podłączyć repozytorium kopii zapasowych.
- Odłącz repozytorium . Można odłączyć już podłączone repozytorium kopii zapasowych.
- Wysyłaj wiadomości e-mail . Można wysłać wiadomość e-mail po wykonaniu odpowiedniej czynności, na przykład po pomyślnym zakończeniu Trybu failover maszyny wirtualnej.
- Oczekuj . Można odczekać określony czas przed przejściem do następnej czynności.
- Sprawdź warunek . Przed przejściem do następnej czynności można sprawdzić następujące warunki: czy zasób istnieje, czy zasób działa oraz czy adres IP/nazwa hosta jest dostępna.
Możesz elastycznie korzystać z wymienionych działań, tworząc różne zadania odzyskiwania lokacji dla różnych przypadków użycia i scenariuszy. Kliknij przycisk Uruchom zadanie, a wszystkie działania zostaną uruchomione automatycznie w określonej kolejności. Zadania odzyskiwania lokacji można uruchamiać ręcznie w trybie produkcyjnym i testowym, ale po skonfigurowaniu zadań odzyskiwania lokacji do automatycznego uruchamiania jako zaplanowane zadania są one uruchamiane w trybie testowym.
Korzyści z Odzyskiwania lokacji
Odzyskiwanie lokacji to potężna, wygodna i intuicyjna funkcja. Ta funkcja może uprościć odzyskiwanie awaryjne dla środowisk wirtualnych VMware vSphere, a także pozwala poświęcić mniej wysiłku i inwestycji na ciągłość działania.
Podsumowując korzyści płynące z Odzyskiwania lokacji:
- Pomaga wdrożyć złożone plany odzyskiwania w ramach strategii odzyskiwania awaryjnego.
- Automatyzuje proces odzyskiwania awaryjnego.
- Skraca czas poświęcony na odzyskiwanie awaryjne. (W rezultacie masz mniej przestojów, mniej przerw w świadczeniu usług i obniżone koszty.)
- Zadania odzyskiwania lokacji mogą być testowane automatycznie w celu wykrycia, czy plan odzyskiwania lokacji jest aktualny, a także czy można spełnić RPO i RTO.
- Odzyskiwanie lokacji nie jest funkcją samodzielną, ale jest wbudowane w potężne i uniwersalne rozwiązanie do ochrony danych maszyn wirtualnych, gdzie można nim zarządzać z jednego panelu.
- Ma przystępną politykę cenową. Nie musisz kupować osobnej licencji na korzystanie z Site Recovery, jeśli masz już licencję na odpowiednią edycję NAKIVO Backup & Replication.
Wnioski
Odzyskiwanie awaryjne środowiska wirtualnego VMware vSphere jest ważnym procesem zapewniającym ciągłość działania. Najlepsze rozwiązania VMware w zakresie odzyskiwania awaryjnego obejmują tworzenie planu odzyskiwania awaryjnego, a także automatyczne tworzenie replik maszyn wirtualnych wymaganych w Trybie failover. Zaleca się korzystanie z kopii zapasowych i replikacji maszyn wirtualnych jako uzupełnienie funkcji klastrowania vSphere. Określ kolejność odzyskiwania maszyn wirtualnych, przygotuj lokalizację awaryjną (w tym elementy sieciowe i pamięci masowej), pamiętaj o regularnym testowaniu planu odzyskiwania awaryjnego oraz korzystaj z odpowiedniego rozwiązania do ochrony danych, które obsługuje wykonanie kopii zapasowej, replikację i odzyskiwanie maszyn wirtualnych na poziomie hosta.
NAKIVO Backup & Replication to uniwersalne rozwiązanie do ochrony danych maszyn wirtualnych, z wsparciem dla maszyn wirtualnych VMware. Odzyskiwanie lokacji to nowa, potężna funkcja dostępna w NAKIVO Backup & Replication od wersji 8.0. Odzyskiwanie lokacji pozwala wdrożyć plan odzyskiwania awaryjnego poprzez tworzenie zautomatyzowanych zadań odzyskiwania lokacji. Ta przydatna funkcja pomaga w orkestracji i automatyzacji procesu odzyskiwania awaryjnego, szybkim odzyskiwaniu danych maszyn wirtualnych oraz zapewnieniu wysokiego poziomu ochrony danych.
Pobierz NAKIVO Backup & Replication z Odzyskiwaniem lokacji i wypróbuj produkt w swoim środowisku VMware vSphere.