Disaster Recovery-Tests und warum Ihr Unternehmen sie benötigt
< & & Unabhängig davon, wie zuverlässig Hardware und Software heute geworden sind, sind Maschinen aus verschiedenen Gründen immer noch anfällig für Ausfälle. Wenn sie abstürzen, können Systeme offline gehen und Daten für längere Zeit nicht verfügbar sein. Und selbst wenn Systeme wieder online gehen, lassen sich Daten manchmal nicht wiederherstellen und sind unwiderruflich verloren. Der zuverlässigste Weg, diese Risiken zu mindern, ist die Einrichtung eines umfassenden Disaster Recovery-Plans (DR).
Ein Disaster Recovery-Plan ist eine Reihe von Verfahren, die durchgeführt werden müssen, um Daten und Workloads innerhalb festgelegter Zeitlimits wiederherzustellen. Diese detaillierte DR-Checkliste enthält Mechanismen, die im Voraus eingerichtet werden, um sich auf verschiedene Katastrophenszenarien vorzubereiten.
Statistiken zeigen, dass 95 % der Unternehmen weltweit erhebliche Ressourcen in die Planung für den Ernstfall investieren, einschließlich Disaster Recovery. Allerdings nutzen nur 78 % von ihnen Disaster-Recovery-Tests , um zu überprüfen, ob ihr Plan tatsächlich die Ziele erfüllt. Lesen Sie weiter, um zu erfahren, was Disaster-Recovery-Tests sind und wie Sie eine Disaster-Recovery-Teststrategie für Ihr Unternehmen entwickeln können, um die Systemverfügbarkeit und Geschäftskontinuität bei jedem Vorfall sicherzustellen.
Was sind Disaster-Recovery-Tests?
Disaster-Recovery-Tests dienen der Überprüfung der Schritte des Disaster-Recovery-Plans, um sicherzustellen, dass der Plan erfolgreich umgesetzt werden kann und kritische Anwendungen und Daten nach einer Störung wiederhergestellt werden können. Das Testen des Disaster-Recovery-Plans soll sicherstellen, dass der Geschäftsbetrieb und kritische Dienste während und nach einem Vorfall aufrechterhalten werden können.
Disaster-Recovery-Tests in ihrer umfassendsten Form umfassen die Simulation eines IT-Ausfalls oder einer anderen Art von Geschäftsunterbrechung, um den bestehenden DR-Plan zu bewerten. Die Hauptziele von Disaster-Recovery-Tests bestehen darin, zu überprüfen, ob ein Unternehmen die im Disaster-Recovery-Plan festgelegten Wiederherstellungszeit-Ziele (RTOs) und Ziele der Wiederherstellungspunkte (RPOs) einhalten kann. Sie sollten die Unterschiede zwischen RPOs und RTOs verstehen und diese für jede Anwendung und VM festlegen. Der DR-Test liefert auch Erkenntnisse darüber, wie sich das System verhält, wenn ein Teil Ihrer Infrastruktur ausfällt. Diese Informationen können Ihnen helfen, den DR-Plan Ihres Unternehmens zu verfeinern und Schwachstellen zu beheben, bevor es zu einer tatsächlichen Störung kommt.
Beachten Sie, dass ein Disaster-Recovery-Testplan nicht auf die technischen Komponenten des DR-Plans beschränkt sein sollte. Genauso wichtig ist es, zu testen, ob alle an der Disaster Recovery beteiligten Mitarbeiter ihre Rolle verstehen und während einer Störung Zugang zu den Ressourcen haben, die sie zum Erfüllen ihrer Aufträge benötigen.
Disaster Recovery-Pläne sollten regelmäßig getestet werden, vorzugsweise mehrmals pro Jahr. IT-Umgebungen ändern sich regelmäßig, da Software außer Betrieb genommen, neue Anwendungen eingeführt oder Hardware ersetzt wird, was wiederum entsprechende Änderungen an Ihrem DR-Plan erforderlich macht. Der DR-Testprozess kann Teil der Wartungsroutinen und Mitarbeiterschulungen sein.
Warum das Testen der Disaster Recovery wichtig ist
Das Risiko, einen Disaster Recovery-Plan nicht zu testen, besteht im Verlust von Daten und im Verlust des Zugriffs auf Systeme. Sie können Ihr Unternehmen gegen Verluste versichern, aber keine Versicherungspolice kann die durch einen Vorfall verlorenen Daten oder die Auswirkungen einer längeren Ausfallzeit auf ein Unternehmen ersetzen. Die einzige Möglichkeit, die Betriebszeit und Verfügbarkeit wirklich sicherzustellen, besteht darin, einen Disaster-Recovery-Plan zu erstellen und regelmäßige Tests durchzuführen. Wenn Sie immer noch nicht davon überzeugt sind, dass das Testen des Disaster-Recovery-Plans notwendig ist, finden Sie hier eine Liste der Vorteile, die DR-Tests Ihnen bieten, bevor ein Vorfall eintritt:
- Erkennen Sie Lücken oder Mängel in einem Disaster-Recovery-Plan
- Stellen Sie sicher, dass Sie während der Wiederherstellung die richtige Abfolge von Aktionen haben
- Überprüfen Sie, dass die Ziele der Wiederherstellung realistisch sind und erreicht werden können
- Minimieren Sie Datenverluste
- Durchlaufen Sie die Aktionen des DR-Teams und stellen Sie sicher, dass jedes Mitglied seine Rolle versteht
- Führen Sie Updates und Korrekturen ein, bevor es zu spät ist
Komponenten eines Disaster-Recovery-Testprozesses
Ein Disaster-Recovery-Test sollte so geplant werden, dass er Ergebnisse liefert und zur Verbesserung der DR-Bereitschaft hilft. Das bedeutet, dass die Ziele des Disaster-Recovery-Tests klar sein sollten und dass Sie einen festen Zeitplan für die Häufigkeit der Tests, die Erfolgskriterien, die Bewertung der Ergebnisse und die Schritte zur Behebung von Lücken und DR-Fehlern haben sollten. Lassen Sie uns diese Komponenten genauer betrachten.
Festlegen des Umfangs des Disaster-Recovery-Tests
Der Umfang des Disaster-Recovery-Tests umfasst eine Reihe von Annahmen und Erwartungen, die während des Testprozesses erfüllt werden sollten. Die Festlegung des Testumfangs sollte Folgendes umfassen:
- Identifizierung der Systeme und Funktionen, die in den DR-Test einbezogen werden
- Definition der Art des zu testenden Disaster-Recovery-Prozesses: Wiederherstellung vollständiger Maschinen von Backups, Failover zu einem DR-Standort usw.
- Festlegung von Ausnahmen und Einschränkungen im Voraus, da einige Komponenten Ihres DR-Plans möglicherweise nicht wie geplant ausgeführt werden können
- Festlegung der Abteilungen und Mitarbeiter, die beim DR-Testprozess beteiligt sind
- Festlegen der zu testenden Szenarien: Ausfall des Primärservers, Ransomware-Angriff, Verbindungsabbruch, Server-/Datenbankausfall usw.
Überprüfen des Disaster Recovery-Plans
Vor dem Test sollten Sie den Disaster Recovery-Plan überprüfen. Disaster Recovery-Tests sollten auf organisierte Weise durchgeführt werden, wobei der Schwerpunkt auf den Richtlinien und Praktiken des Unternehmens liegen sollte. Daher sollte sich das Disaster-Recovery-Team mit dem Management zusammensetzen, um den bestehenden DR-Plan zu überprüfen und zu entscheiden, welche Änderungen oder Aktualisierungen aufgrund der aktuellen Geschäftslage vorgenommen werden sollten. Dazu gehören Faktoren wie die Einführung neuer Hardware- oder Softwareprodukte, die Erweiterung des Geschäfts, Budgetkürzungen, Personalfluktuation usw.
Häufigkeit der Disaster-Recovery-Tests
Angesichts der hohen Dynamik der aktuellen IT-Umgebungen ist die Festlegung der Überprüfungshäufigkeit entscheidend, um Ihren Disaster-Recovery-Plan ständig auf dem neuesten Stand zu halten. Einige Unternehmen überprüfen und aktualisieren ihre DR-Pläne einmal pro Jahr. Die effizienteste Strategie besteht jedoch darin, Ihren DR-Plan zu aktualisieren (und erneut zu testen), sobald sich geschäftskritische Komponenten Ihres Unternehmens ändern. Da Disaster-Recovery-Tests zeitaufwändig und kostspielig sein können, sollten Sie Ihren Testplan auf der Grundlage der geschäftlichen Anforderungen und Ressourcen unter Berücksichtigung des Umfangs der Disaster-Recovery-Prozesse erstellen.
Kriterien für den Test Erfolg
Sie müssen Kriterien festlegen, anhand derer Sie bestimmen können, ob Ihre VM-Disaster-Recovery-Tests erfolgreich waren oder nicht. Im Idealfall kann ein VM-DR-Test als bestanden gelten, wenn sich ein DR-Plan als gültig und durchführbar erwiesen hat.
Disaster Recovery-Tests können jedoch auch dann als erfolgreich angesehen werden, wenn ein DR-Plan den Test nicht bestanden hat. In diesem Szenario können Sie Mängel in einem DR-Plan vor einer tatsächlichen Katastrophe identifizieren und diese in der weiteren Iteration des Plans beheben. Im Wesentlichen werden die Kriterien für den Testerfolg auf der Grundlage vorab festgelegter Erwartungen definiert, die im Disaster Recovery-Testplan klar formuliert sein sollten, um Verwirrung zu vermeiden.
Bewertung der Testergebnisse
Die Ergebnisse eines VM-Disaster-Recovery-Testprozesses bieten einen allgemeinen Überblick über die derzeit im Unternehmen verwendeten DR-Strategien. Das Recovery-Team kann die Testergebnisse auswerten und auf der Grundlage der identifizierten Probleme Verbesserungen oder Anpassungen für den DR-Plan vorschlagen.
Bei der Bewertung der DR-Testergebnisse sollten auch die folgenden Kennzahlen berücksichtigt werden:
- Wie viel Zeit verging, bis geschäftskritische Aktivitäten wiederhergestellt waren?
- Wie gut wurde jeder Schritt des Plans ausgeführt (traten Fehler und Verzögerungen auf)?
- Wie viele Vorgänge wurden während des DR-Testprozesses erfolgreich abgeschlossen?
Änderungen und Aktualisierungen sollten vorgenommen und getestet werden, um den DR-Plan zu verbessern. Das Ziel ist es, einen effektiveren und besser verwaltbaren Wiederherstellungsprozess zu schaffen.
Überprüfung des DR-Plans nach dem Test
Nach der Ausführung eines Disaster-Recovery-Plans im Testmodus ist es ratsam, Ihren DR-Plan noch einmal zu überprüfen. Stärken und Schwächen sowie unerwartete Ergebnisse sollten während des Disaster-Recovery-Testprozesses aufgezeichnet und ihre Auswirkungen auf die Geschäftskontinuität gemessen werden. Dies kann Ihre DR-Strategien erheblich verbessern und die Leistung steigern. Maßnahmen zur Behebung von Lücken und Fehlern sollten detailliert beschrieben und in die weitere Version des DR-Plans aufgenommen werden.
Faktoren, die vor dem Testen des Disaster Recovery-Plans zu berücksichtigen sind
- Anzahl der Personen im Disaster Recovery-Team: Ein Disaster Recovery-Team sollte aus mindestens zwei Personen bestehen, um das Problem eines „Single Point of Failure” zu vermeiden. Wenn mehrere Teammitglieder vorhanden sind, können Sie sicher sein, dass es einen Ersatz mit den erforderlichen Kenntnissen und Zugang zum DR-Standort gibt, falls eine Person während einer Katastrophe nicht erreichbar ist.
- Für Disaster-Recovery-Tests gewählter Tageszeitpunkt: Im Allgemeinen werden DR-Tests außerhalb der Arbeitszeiten durchgeführt, da der Prozess zeitaufwändig ist und den Geschäftsbetrieb unterbrechen oder die Gesamtleistung beeinträchtigen könnte. Diese Testergebnisse sind jedoch möglicherweise kein Indikator dafür, wie der Disaster-Recovery-Plan unter tatsächlichen Arbeitsbedingungen funktionieren würde. Die isolierte Prüfung der Komponenten eines VM-Disaster-Recovery-Plans während der Arbeitszeit könnte eine ideale Lösung sein. Dies trägt dazu bei, das Risiko einer Systemüberlastung zu verringern, das bei vollständigen Tests besteht.
- Änderungen im Team oder in der IT-Infrastruktur: Bevor Sie den Disaster-Recovery-Plan testen, sollten Sie die verschiedenen Faktoren berücksichtigen, die Ihren DR-Plan unvollständig und veraltet machen könnten. Wie oben erwähnt, können diese Faktoren unter anderem neue Infrastrukturkomponenten und Personalveränderungen umfassen. Halten Sie das DR-Team über neue Änderungen an der Umgebung auf dem Laufenden und senden Sie kurze Memos, um die Mitarbeiter über die neuesten Aktualisierungen zu informieren.
Methoden zum Testen der Disaster Recovery
In diesem Abschnitt behandeln wir die vier gängigsten Methoden zum Testen der Disaster Recovery. Prüfen Sie diese sorgfältig, bevor Sie entscheiden, welcher Ansatz für Ihr Unternehmen der richtige ist oder ob eine Kombination dieser Ansätze verwendet werden kann.
Checklistenprüfung
Bei einer Checklistenprüfung eines Disaster-Recovery-Plans werden die Liste der Anforderungen und Bedingungen, die erfüllt sein müssen, getestet. Diese Überprüfung ist ein guter Ausgangspunkt, da sie die grundlegendste Option darstellt und die Analyse des aktuellen Plans sowie die Überprüfung jedes einzelnen Punktes umfasst, um veraltete oder fehlende Teile zu erkennen. Das bedeutet beispielsweise, dass überprüft wird, ob der Backup-Standort ausreichend groß ist, ob das Wiederherstellungsteam über die neuesten Aktualisierungen informiert ist, ob die Lösung für Datensicherheit funktioniert usw.
Mit dieser DR-Testmethode kann das Wiederherstellungsteam den DR-Plan schnell überprüfen, sicherstellen, dass alle Komponenten vorhanden sind, und fehlende Komponenten in der DR-Strategie identifizieren. Dieses Verfahren kann in kürzester Zeit und ohne großen Personalaufwand durchgeführt werden.
Walkthrough-DR-Test
Der Zweck dieser Strategie besteht darin, jeden Schritt eines VM-Disaster Recovery-Plans mündlich durchzugehen und etwaige Probleme und Mängel zu identifizieren. Hier nehmen alle Mitglieder eines Teams für die Wiederherstellung an der Überprüfung und Diskussion des DR-Plans teil und erarbeiten Empfehlungen.
Es ist wichtig, sicherzustellen, dass alle Beteiligten den Plan genau verstehen und sich ihrer Verantwortlichkeiten während eines DR-Ereignisses bewusst sind. Bei dieser Methode wird der DR-Prozess nur mündlich besprochen. Die technologischen Aspekte Ihres DR-Plans werden bei Walkthrough-Tests nicht tatsächlich getestet oder genehmigt.
Tabletop-/Simulations-DR-Tests
Bei einem Tabletop-Test durchläuft die Organisation ein simuliertes Katastrophenszenario, um festzustellen, ob ein DR-Plan angemessen ist und die definierten Ziele erreicht werden können. Diese DR-Testmethode kann als Erweiterung des Walkthrough-Tests betrachtet werden. Allen Teammitgliedern werden verschiedene Katastrophenszenarien vorgelegt, die sie durch Besprechung ihrer möglichen Vorgehensweise in den jeweiligen Situationen überprüfen. Auf diese Weise können Sie die Bereitschaft Ihrer Mitarbeiter in einer realistischeren Umgebung testen und überprüfen, ob Ihr Disaster Recovery-Plan auch unerwartete Probleme bewältigen kann.
- Tabletop-Durchlauf. Das DR-Team führt Schritt für Schritt eine Plan-Durchsicht durch, als ob eine echte Katastrophe eingetreten wäre. Diese Methode zum Testen der Disaster Recovery hilft dabei, potenzielle blinde Flecken und versteckte Probleme zu identifizieren.
- Szenariosimulation. Bei dieser Methode wird der DR-Plan in einer Testumgebung ausgeführt, ohne den Produktionsablauf zu stören. Die Simulation wird gemäß spezifischen Szenarien für die Wiederherstellungdurchgeführt.
- Vollständige Disaster-Recovery-Simulation. Diese DR-Testmethode ähnelt der oben beschriebenen Simulation, jedoch umfasst das Szenario diesmal den vollständigen Ausfall des Betriebs an Ihrem Hauptstandort. Die Methode umfasst den Versuch einer vollständigen Wiederherstellung außerhalb des Standorts.
Parallele Tests
Mit parallelen Tests können Sie die Funktionalität Ihrer Systeme für die Wiederherstellung testen, um festzustellen, ob sie Geschäftsabläufe ausführen und die Sicherheit kritischer Prozesse gewährleisten können. Die Primärsysteme sind nicht in den Disaster-Recovery-Testprozess einbezogen, da von ihnen erwartet wird, dass sie die gesamte Produktionslast unterstützen. Dies ist eine sichere und nicht störende Methode zum Testen technischer Systeme.
Vollständiger Unterbrechungstest
Ein vollständiger Unterbrechungstest ermöglicht eine gründliche Prüfung Ihres VM-DR-Plans. In diesem Fall übernimmt Ihr DR-Standort die gesamte Produktionslast, während der Primärstandort abgeschaltet wird. Das Ziel besteht darin, mithilfe des unternehmensinternen Disaster-Recovery-Plans eine möglichst schnelle Wiederherstellung zu erreichen. Die Durchführung eines Tests mit vollständiger Unterbrechung sollte gut durchdacht sein, da der normale Betrieb gestört werden kann und die Kosten recht hoch sind.
Jeder einzelne Wiederherstellungsprozess sollte dokumentiert werden. Identifizieren Sie alle Probleme und Bedenken während der Durchführung des DR-Tests, um sie später zu beheben. Die Aktionen des Wiederherstellungsteams sollten genau beobachtet werden, um mögliche Lücken in Ihrem VM-DR-Plan aufzudecken. Vollständige Unterbrechungstests sind auch eine geeignete Methode zur Überprüfung Ihrer Disaster Recovery-Ziele, um festzustellen, ob diese akzeptabel und erreichbar sind.
Sie können den vollständigen Unterbrechungstest auch ohne vorherige Benachrichtigung Ihrer Mitarbeiter durchführen. So können Sie die Bereitschaft Ihres Teams im Katastrophenfall genauer einschätzen.
Nützliche Tipps für Disaster-Recovery-Tests
Das Testen eines Disaster-Recovery-Plans ist eine wichtige Aufgabe, die manchmal überwältigend erscheinen kann. Die folgenden Tipps für Disaster-Recovery-Tests können Ihnen helfen, Zeit zu sparen und Stress zu reduzieren:
- Testen Sie neue Hardware- oder Softwareprodukte sofort nach der Installation, um ihre Funktionalität und Integrität zu überprüfen. Dies hilft Ihnen auch dabei, die RTO des Produkts zu ermitteln und zu erfahren, wie es sich während DR-Verfahren verhalten könnte.
- Führen Sie eine Risikoanalyse (RA) und eine Business Impact Analysis (BIA) durch, bevor Sie Ihren DR-Plan entwerfen. Überprüfen Sie die Ergebnisse dieser Analysen regelmäßig und überlegen Sie bei Änderungen, wie diese in Ihrer DR-Strategie berücksichtigt werden sollten.
- Die Tests sollten unter Bedingungen durchgeführt werden, die einem DR-Szenario so ähnlich wie möglich sind. Durch die Simulation eines realistischen Katastrophenszenarios können Sie sehen, wie gut Ihre Mitarbeiter ihre Aufgaben in DR-Situationen erfüllen. Dies trägt auch dazu bei, den Stress Ihrer Mitarbeiter zu reduzieren, da sie sich an verschiedene DR-Szenarien gewöhnen und lernen, was von ihnen erwartet wird.
- Laden Sie unabhängige Beobachter ein, Ihren DR-Plan zu überprüfen und den Testprozess zu überwachen. Dieser Ansatz stellt sicher, dass Ihre Mitarbeiter keine Abkürzungen nehmen, um die Tests schnell abzuschließen. Darüber hinaus können unabhängige Beobachter dabei helfen, einen DR-Plan zu überarbeiten und zu verbessern, da sie oft Probleme erkennen, die für die Mitarbeiter innerhalb des Unternehmens nicht sichtbar sind.
- Erstellen Sie eine vollständige Liste aller Anwendungen in Ihrer Infrastruktur. Diese Liste sollte die Details jeder Anwendung, ihre Konfigurationen, die Kontaktdaten der Anwendungsinhaber und Ihre Vertrags-/Lizenzdetails enthalten.
- In der Anfangsphase sollten DR-Tests in Teilen und nach Geschäftsschluss durchgeführt werden, um das System nicht zu überlasten. Nachdem Sie etwaige Mängel identifiziert und den Plan entsprechend verbessert haben, können Sie weitere vollständige Tests während der Geschäftsstunden durchführen.
Disaster Recovery mit NAKIVO Backup & Replikation & >
NAKIVO Backup & Replikation ist eine zuverlässige Lösung für Backup und Disaster Recovery. Die Lösung ermöglicht Ihnen die Automatisierung von Backup-, Replikations- und Disaster-Recovery-Prozessen und gewährleistet gleichzeitig die Datenintegrität über verschiedene Plattformen hinweg (physisch, virtuell oder Cloud). Die NAKIVO-Lösung enthält VM-Replikation, VM-Failover, Failback und Standortwiederherstellung Funktionen für die Disaster Recovery. Darüber hinaus können Sie eine Disaster-Recovery-Sequenz testen, um sicherzustellen, dass alles korrekt konfiguriert ist.
Ausführen von Standortwiederherstellungs-Aufträgen im Testmodus
Mit NAKIVO Backup & Replikation können Sie Standortwiederherstellungs-Aufträge im Testmodus ausführen, um zu überprüfen, ob alle Systemkomponenten während eines Disaster-Recovery-Ereignisses problemlos wiederhergestellt werden können und die festgelegten DR-Ziele erreicht werden können. Dieser Test beeinträchtigt die Produktions-Workloads nicht. Ein Standortwiederherstellungs-Auftrag im Testmodus kann sowohl geplant als auch auf Anfrage ausgeführt werden.
Die folgende Anleitung erklärt Ihnen, wie Sie einen Standortwiederherstellungs-Auftrag manuell im Testmodus ausführen. Beachten Sie, dass ein Standortwiederherstellungs-Auftrag zuerst konfiguriert werden muss.
- Wählen Sie im Jobs Dashboard einen Standortwiederherstellungs-Auftrag aus und klicken Sie dann auf die Schaltfläche Run Job . Das Dropdown-Menü bietet Ihnen zwei Optionen. Klicken Sie auf „ <“ „>“ Test site recovery< „> “ Auftrag. „<“ „>
<“ „>
<“ „><“ „><“ „>
<“ „>
<“ „>“ Im daraufhin angezeigten Dialogfeld können Sie Ihre RTO-Metriken konfigurieren. Legen Sie die maximal zulässige Zeit fest, die Ihr Standortwiederherstellungs-Auftrag für die Ausführung benötigen darf. Wenn der Testlauf den von Ihnen eingegebenen RTO-Wert überschreitet, gilt der Test als fehlgeschlagen. Sie können diese Option auch deaktivieren.
- Klicken Sie abschließend auf Test , um den Auftrag auszuführen.
Optionen für den Zeitplan zum Testen des Zeitplans
Sie können auch Optionen für den Zeitplan zum Testen des Zeitplans konfigurieren, wenn Sie einen Standortwiederherstellungs-Auftrag konfigurieren. Diese Optionen sind verfügbar, wenn Sie diesen Auftrag im Testmodus ausführen.
E-Mail-Bericht
Wenn diese Option aktiviert ist, erhalten ausgewählte Empfänger jedes Mal, wenn der Auftrag abgeschlossen ist, einen Testbericht. Sie müssen die E-Mail-Benachrichtigungen auf der Registerkarte einstellen. 5. Optionen Registerkarte, bevor Sie auf Fertigstellenklicken.
Sie können einen Bericht auch direkt über einen Webbrowser als PDF- oder CSV-Datei herunterladen. Klicken Sie einfach mit der rechten Maustaste auf einen Standortwiederherstellungs-Auftrag und wählen Sie „ <“ (Bericht herunterladen) „>“ (Standortwiederherstellungs-Auftragsbericht)< „>“ (Standortwiederherstellungs-Auftragsbericht) .


