Procedure consigliate per il ripristino di emergenza VMware

Il ripristino di emergenza è un processo che comprende una serie di misure volte al ripristino dei componenti dell’Infrastruttura dopo il verificarsi di un guasto. Inoltre, il ripristino di emergenza mira a ridurre al minimo gli effetti negativi che possono essere causati da un disastro e a garantire la continuità operativa. Per prepararsi ai possibili tipi di disastri, le aziende di solito redigono un piano di ripristino di emergenza che dovrebbe essere parte integrante di un piano di continuità operativa. Le VM sono i componenti a rischio in caso di disastro; è per questo motivo che è necessario prepararsi al disastro sviluppando un piano di ripristino di emergenza. Questo post del blog esplora le procedure consigliate per il ripristino di emergenza (DR) dell’ambiente virtuale VMware.

Ensure Availability with NAKIVO

Ensure Availability with NAKIVO

Meet strict requirements for service availability in virtual infrastructures. Achieve uptime objectives with robust DR orchestration and automation features.

Redigere un piano di ripristino di emergenza

Un piano di ripristino di emergenza è un documento strutturato che descrive un processo di ripristino di emergenza come un insieme di azioni da eseguire da parte delle persone appropriate in una situazione di emergenza. Inoltre, il documento stabilisce i criteri necessari per avviare il piano di ripristino di emergenza. Sia i catalizzatori naturali che quelli causati dall’uomo possono provocare un disastro. Un piano di ripristino di emergenza dovrebbe includere diversi scenari di ripristino per diversi tipi di disastri e incidenti imprevisti. Ad esempio, un piano di ripristino di emergenza può descrivere cosa fare in caso di attacco ransomware, interruzione di corrente, guasto hardware, terremoto, tifone, ecc. Un piano di DR può essere suddiviso in categorie: ad esempio, la prima sezione potrebbe spiegare il ripristino della rete, la seconda potrebbe concentrarsi sul ripristino del data center, mentre la terza spiegherebbe il ripristino delle VM, ecc.

Preparare l’ambiente di ripristino

Un sito di ripristino di emergenza è un luogo che può essere utilizzato da un’azienda come mezzo per ripristinare l’infrastruttura e i carichi di lavoro quando il sito primario utilizzato per scopi di produzione non funziona. I siti di ripristino di emergenza possono essere di tipo hot, warm o cold.

  • Un sito hot è un sito DR completamente funzionante, dotato di server ESXi configurati, storage, repliche VM e dati utente. Se un sito primario smette di funzionare a seguito di un disastro, un sito hot è pronto per essere utilizzato immediatamente. L’implementazione di un hot site è costosa, ma offre la possibilità di un ripristino il più rapido possibile.
  • Un warm site contiene alcune apparecchiature quali apparecchiature di rete, server gateway, host ESXi e storage, ma potrebbe non contenere VM e dati utente. In questo caso, le VM devono essere ripristinate dai backup e potrebbe essere necessario copiare anche i dati degli utenti. Durante il processo di ripristino di emergenza è possibile installare apparecchiature e software aggiuntivi, pertanto l’utilizzo di un sito caldo è una soluzione di compromesso che richiede costi medi, ma offre tempi di ripristino accessibili.
  • Un sito freddo è un sito DR che dispone solo dell’infrastruttura di base. Quando si verifica un disastro, è necessario configurare i server, effettuare l’implementazione dello storage, ripristinare le VM ed eventualmente estrarre i dati degli utenti dai backup. L’utilizzo di questo tipo di sito DR richiede uno sforzo maggiore per ripristinare le VM e i carichi di lavoro. Questo processo di ripristino richiede molto tempo, ma il costo di un sito freddo è il più basso rispetto ad altri tipi di siti.

Creazione automatica di backup e repliche

I backup e le repliche delle VM sono i componenti più importanti del ripristino di emergenza in un ambiente virtuale VMware vSphere. Il backup include una copia dei dati della VM, che viene archiviata in un luogo sicuro. I dati di backup possono essere compressi e richiedono tempo per essere ripristinati. Una replica VM è una copia identica della VM di origine che risiede su un host ESXi , è pronta per essere avviata quando necessario e viene utilizzata durante il failover . Evitate di eseguire il backup delle VM manualmente troppo spesso, poiché alcune modifiche importanti potrebbero essere trascurate e perse in caso di disastro. Utilizza un software di protezione dei dati delle VM a livello di host appropriato, in grado di creare automaticamente backup e repliche delle VM pianificando una pianificazione.

Utilizza le funzionalità di clustering VMware

VMware offre funzionalità di clustering come il cluster Distributed Resource Scheduler (DRS), il cluster High Availability (HA) e Fault Tolerance (disponibile per le VM in un cluster HA). Un cluster HA consente di ridurre al minimo i tempi di inattività delle VM, mentre Fault Tolerance (FT) consente di evitare i tempi di inattività delle VM in caso di guasto hardware. È importante tenere presente che le funzioni di clustering non sostituiscono il backup e la replica. L’alta disponibilità con tolleranza ai guasti e il backup con replica si completano a vicenda. Il punto è che HA e FT non possono proteggere i dati da danneggiamenti, cancellazione di file all’interno delle VM, aggiornamenti software non riusciti o altri guasti software, ecc.

Utilizzare un ordine di ripristino delle VM appropriato

Le VM devono essere ripristinate nell’ordine appropriato. Immaginate di avere più VM con applicazioni diverse che dipendono l’una dall’altra. L’esempio classico è avere una VM con Active Directory Domain Controller, una VM con un server di database e una VM con un server web. Le VM devono essere avviate nel seguente ordine:

  1. La VM con Domain Controller deve essere avviata per prima.
  2. La VM con un server di database si avvia quando la VM con il controller di dominio è in esecuzione, poiché un server di database utilizza il controller di dominio per l’autenticazione degli utenti.
  3. La VM con un server web si avvia quando la VM con un server di database è in esecuzione, poiché in questo caso il server web utilizza il database per il corretto funzionamento.

Se si dispone di una VM con server di posta MS Exchange, tale VM deve avviarsi dopo la VM con controller di dominio, poiché MS Exchange è integrato con Active Directory per l’autenticazione degli utenti.

Utilizzare una configurazione di rete VM appropriata

Un sito di produzione e un sito di ripristino di emergenza possono avere reti diverse per la connessione VM. Gli adattatori di rete virtuali delle VM sono collegati alle porte degli switch virtuali (vSwitch). I gruppi di porte rappresentano reti diverse con nomi di rete e indirizzi appropriati. Se si ripristina una VM in un sito di DR, ma la VM è configurata per la connessione alla rete di un sito di produzione (che differisce dalla rete utilizzata per le VM in un sito di DR), non è possibile stabilire la connessione di rete della VM. In questo caso, non dimenticare di modificare le impostazioni di rete delle VM quando le ripristini nel sito di DR.

Prepara lo storage della tua VM

Lo storage utilizzato in un sito di DR deve disporre di spazio libero sufficiente per archiviare le VM. Questo è il primo e più importante requisito. Lo storage deve inoltre fornire prestazioni sufficienti, altrimenti i servizi business-critical in esecuzione sulle VM potrebbero subire rallentamenti. Se si utilizza uno storage basato su rete, come NAS (Network Attached Storage) o SAN (Storage Area Network), la velocità della rete deve essere sufficientemente elevata da garantire il corretto funzionamento. La rete di storage in un sito di ripristino di emergenza deve essere una rete dedicata, separata dalle altre reti.

Verificate regolarmente il vostro piano di ripristino

Un piano di ripristino di emergenza può sembrare valido sulla carta, ma può rivelarsi inutile in caso di emergenza se non viene testato in anticipo. Pertanto, assicuratevi di testare regolarmente il vostro piano DR. Il test consente di verificare se il piano di DR è realizzabile e se è possibile soddisfare i requisiti di RTO e RPO . Il test consente inoltre di individuare gli svantaggi del piano di DR e quindi di apportare le modifiche necessarie per risolverli. Testare regolarmente il piano di DR per assicurarsi che l’ambiente virtuale vSphere possa essere ripristinato. L’infrastruttura può cambiare nel tempo e, dopo tali cambiamenti, un piano di DR che fino a poco tempo prima era funzionante potrebbe non soddisfare più i requisiti appropriati. Ad esempio, potrebbero essere aggiunte alcune VM, potrebbero essere modificati gli indirizzi IP, le applicazioni potrebbero essere migrate da una VM a un’altra, ecc. Test regolari consentono di individuare quali parti del piano devono essere aggiornate dopo le modifiche all’infrastruttura, al fine di mantenere il piano di DR in uno stato efficiente.

Trovare la soluzione di ripristino dell’ambiente più adatta

Una volta elaborato il piano di DR, occorre trovare la soluzione di ripristino dell’ambiente più adatta alle proprie esigenze. Nel caso di utilizzo di VMware vSphere, una soluzione dovrebbe supportare il backup/la replica delle VM a livello di host, il ripristino rapido dal backup, il failover su una replica della VM, il ripristino dell’intera VM e il ripristino di singoli oggetti. Cercate di scegliere una soluzione adeguata con le funzionalità appropriate, che consenta di testare e aggiornare regolarmente il piano di Ripristino di emergenza.

NAKIVO Backup & Replica per VMware Ripristino di emergenza

NAKIVO Backup & Replica per VMware Ripristino di emergenza è una soluzione di protezione dei dati delle VM veloce, affidabile e conveniente in grado di proteggere le vostre VM VMware. Tra le molte altre cose, il prodotto è in grado di eseguire il backup e la replica delle VM a livello di host, il ripristino di singoli oggetti, il ripristino istantaneo delle VM e il failover su una replica della VM. Non è necessario installare alcun agente sulle VM, poiché viene utilizzata l’API VMware vStorage per la protezione dei dati. Inoltre, NAKIVO Backup & Replication include una nuova funzionalità di ripristino del sito, con la quale è possibile eseguire il ripristino di emergenza di interi siti con (non solo) VM VMware.

Panoramica del ripristino dell’ambiente

Ripristino dell’ambiente è una potente funzione che consente di ripristinare le VM da un sito all’altro in caso di disastro. Questa funzione può essere utilizzata anche per la migrazione pianificata delle VM tra siti. È possibile creare flussi di lavoro di ripristino automatizzati ed eseguirli per il failover pianificato o di emergenza, nonché a scopo di test.

Funzionalità di ripristino dell’ambiente

Ripristino dell’ambiente consente di automatizzare e orchestrare un processo di ripristino di emergenza delle VM. La funzione include una serie di azioni e condizioni che è possibile combinare in un lavoro di ripristino dell’ambiente (processo) in base al proprio piano di ripristino di emergenza. Queste azioni sono:

  • Failover delle VM. È possibile eseguire il failover su una replica della VM (la replica della VM deve essere creata prima di eseguire l’azione di failover).
  • Failback delle VM. È possibile trasferire i carichi di lavoro da una replica VM archiviata in un sito DR a una VM di origine archiviata in un sito di produzione.
  • Avvio VM. È possibile avviare una o più VM.
  • Arrestare le VM. È possibile arrestare una o più VM.
  • Eseguire lavori. È possibile eseguire lavori (backup, replica, avvio flash delle VM, ecc.) creati nell’istanza NAKIVO Backup & Replication & Replication.
  • Arresta lavori. È possibile arrestare i lavori in esecuzione.
  • Esegui script. È possibile eseguire uno script su un computer con l’istanza di NAKIVO Backup & Replication & , su un computer Windows remoto, un computer Linux remoto, una macchina virtuale VMware, una macchina virtuale Hyper-V o un’istanza di EC2.
  • Collega repository. È possibile collegare un repository di backup.
  • Scollega repository. È possibile scollegare il repository di backup già collegato.
  • Inviare e-mail. È possibile inviare un’e-mail dopo l’azione appropriata, ad esempio se il failover della VM è stato completato con successo.
  • Attendere. È possibile attendere un tempo definito prima di procedere all’azione successiva.
  • Controlla condizione. È possibile verificare le seguenti condizioni prima di procedere all’azione successiva: se una risorsa esiste, se una risorsa è in esecuzione e se l’IP/nome host è raggiungibile.

È possibile utilizzare in modo flessibile le azioni elencate per creare diversi lavori di ripristino dell’ambiente per diversi casi d’uso e scenari. Fare clic sul pulsante Esegui lavoro e tutte le azioni verranno avviate automaticamente nell’ordine definito. I lavori di ripristino dell’ambiente possono essere eseguiti manualmente in modalità di produzione e di test, ma quando si configurano i lavori di ripristino dell’ambiente per l’esecuzione automatica come attività pianificate, questi vengono eseguiti in modalità di test.

Vantaggi del ripristino dell’ambiente

Il ripristino dell’ambiente è una funzione potente, comoda e intuitiva. Questa funzione semplifica il ripristino di emergenza per gli ambienti virtuali VMware vSphere e consente di ridurre gli sforzi e gli investimenti necessari per garantire la continuità operativa .Per riassumere i vantaggi di Site Recovery:

  • Aiuta a implementare piani di ripristino dell’ambiente complessi nell’ambito della strategia di ripristino di emergenza.
  • Automatizza il processo di ripristino di emergenza.
  • Riduce il tempo dedicato al ripristino di emergenza. (Di conseguenza, si riducono i tempi di inattività, le interruzioni dei servizi e i costi).
  • I lavori di ripristino dell’ambiente possono essere testati automaticamente per verificare se il piano di ripristino dell’ambiente è aggiornato e se è possibile rispettare gli obiettivi RPO e RTO.
  • Il ripristino dell’ambiente non è una funzione autonoma, ma è integrato nella potente e universale soluzione di protezione dei dati VM, dove può essere gestito da un unico pannello di controllo.
  • Ha una politica dei prezzi accessibile. Non è necessario acquistare una licenza separata per utilizzare Site Recovery se si dispone già di una licenza per l’edizione appropriata di NAKIVO Backup & Replication & Replication.

Conclusione

Il ripristino di emergenza di un ambiente virtuale VMware vSphere è un processo importante per garantire la continuità operativa. Le procedure consigliate di VMware per il ripristino di emergenza includono la creazione di un piano di ripristino di emergenza e la creazione automatica delle repliche delle VM necessarie per il failover delle VM. Si consiglia di utilizzare il backup e la replica delle VM oltre alle funzioni di clustering di vSphere. Definisci l’ordine di ripristino delle VM, prepara il sito di Ripristino di emergenza (compresi i componenti di rete e di archiviazione), assicurati di testare regolarmente il piano di Ripristino di emergenza e utilizza una soluzione di protezione dei dati adeguata che supporti il backup, la replica e il ripristino delle VM a livello di host. NAKIVO Backup & Replication è una soluzione universale per la protezione dei dati delle VM con supporto per le macchine virtuali VMware. Site Recovery è una nuova potente funzionalità inclusa in NAKIVO Backup & Replication dalla versione 8.0. Site Recovery consente di implementare il piano di Ripristino di emergenza creando processi automatizzati di ripristino del sito. Questa utile funzionalità aiuta a orchestrare e automatizzare il processo di Ripristino di emergenza, ripristinare rapidamente i dati delle VM e garantire un elevato livello di protezione dei dati. Scaricate NAKIVO Backup & Replication con Site Recovery e provate il prodotto nel vostro ambiente VMware vSphere.

Try NAKIVO Backup & Replication

Try NAKIVO Backup & Replication

Get a free trial to explore all the solution’s data protection capabilities. 15 days for free. Zero feature or capacity limitations. No credit card required.

Le persone leggono anche