Lista di controllo del piano di continuità operativa

<> & Un’interruzione o un disastro possono verificarsi quando meno te lo aspetti. Infatti, l’80% dei responsabili dei data center ha subito un’interruzione negli ultimi tre anni. Che si tratti di un attacco informatico, di un’infezione da ransomware, di un errore umano o di un disastro naturale, un lungo periodo di inattività può avere un impatto negativo sulle operazioni della vostra organizzazione.

Disporre di un solido piano di continuità operativa (BCP) come parte della vostra strategia di gestione dei rischi vi consente di mantenere o ripristinare rapidamente le funzioni critiche in caso di interruzione. Un BCP protegge anche l’infrastruttura dell’azienda e funge da linea guida da seguire per rispondere adeguatamente a un incidente.

Questo post elenca gli elementi essenziali della checklist del piano di continuità operativa. Continuate a leggere per rilevare la migliore linea d’azione da intraprendere per riprendere con successo le operazioni con ripercussioni minime.

Ensure Availability with NAKIVO

Ensure Availability with NAKIVO

Meet strict requirements for service availability in virtual infrastructures. Achieve uptime objectives with robust DR orchestration and automation features.

Perché è necessario un piano di continuità operativa

Un piano di continuità operativa (BCP) determina come un’organizzazione può continuare a fornire prodotti e servizi durante interruzioni impreviste. Il BCP è una strategia dettagliata che aiuta a mitigare l’impatto di un disastro sulle attività quotidiane, mantenendo al contempo l’ambiente di produzione in funzione.

Un BCP completo dovrebbe affrontare tutte le potenziali minacce che potrebbero mettere in pericolo i vostri dipendenti, le vostre risorse e le vostre operazioni, che si tratti di un’interruzione di corrente, di un’infezione da malware o di un disastro naturale. Ciò è particolarmente importante poiché tutti questi eventi possono causare tempi di inattività che, a loro volta, comportano perdite finanziarie, danni alla reputazione o la chiusura definitiva.

Lo scopo principale del piano di continuità operativa è garantire la preparazione alle emergenze, consentendo al team di risposta di completare metodicamente le fasi necessarie prima, durante e dopo uno scenario di interruzione. Le aziende che non dispongono di questa checklist possono avere difficoltà a mantenere i normali processi aziendali e rischiano di perdere dati, sistemi o clienti, spesso in modo irreparabile.

Il piano di continuità operativa in 7 fasi

La checklist in 7 fasi aiuta a formulare un quadro generale di priorità su cui basarsi per creare un piano di continuità operativa su misura per la propria organizzazione. È possibile includere tutte le procedure necessarie per mantenere le operazioni aziendali durante una crisi. È importante tenere presente che i dettagli esatti variano da un’azienda all’altra in base a diversi aspetti, quali le dimensioni dell’azienda, il settore e il tipo di minacce.

Il piano di continuità operativa standard include in genere i seguenti passaggi:

  1. Creare un team di risposta alle emergenze
  2. Identificare i servizi aziendali essenziali
  3. Condurre una valutazione dei rischi e un’analisi dell’impatto sul business
  4. Sviluppare un piano di ripristino
  5. Definire gli obiettivi di ripristino e designare un sito DR
  6. Assicurarsi che tutti i carichi di lavoro critici per l’azienda siano protetti
  7. Testare e aggiornare il piano di continuità operativa

Esaminiamo più da vicino ciascuno di questi passaggi per capire perché sono elementi importanti di qualsiasi checklist BCP.

1. Creare un team di risposta alle emergenze

Il primo passo nella formulazione di un piano di continuità operativa è quello di costituire il team responsabile di mantenere l’azienda operativa in caso di emergenza. Il team BCP dovrebbe includere membri di ciascun reparto coinvolto nelle operazioni quotidiane e dovrebbe avere un manager designato a guidare gli sforzi di pianificazione della continuità operativa.

Quando si identificano le figure chiave del BCP, è necessario creare un elenco completo dei disastri che rappresentano la minaccia maggiore per la propria organizzazione, in modo da poter reclutare le persone giuste. Diversi tipi di emergenze, come guasti al sistema IT, interruzioni di corrente o danni alle strutture, richiedono membri del personale con conoscenze e competenze specifiche per gestirle in modo adeguato e rapido.

Creare una tabella per registrare le informazioni necessarie sui membri del team di risposta, in modo da poterli contattare facilmente quando necessario. La tabella può includere il nome, la posizione, il ruolo nel team di risposta e le informazioni di contatto. Tenere presente che è necessario assegnare almeno un sostituto per ogni ruolo nel team. Ciò consente di evitare colli di bottiglia nel caso in cui i delegati principali non riescano a svolgere le loro responsabilità.

2. Identificare i servizi aziendali essenziali

Uno degli scopi principali del piano di continuità operativa è quello di aiutarti a identificare i processi, le attrezzature e le risorse fondamentali per il funzionamento della tua organizzazione. Si tratta delle funzioni e dei servizi di Infrastruttura importanti su cui dovresti basare il tuo BCP.

Questi servizi chiave ed elementi dell’infrastruttura includono molto probabilmente:

  • Sistemi di alimentazione e generatori
  • Dispositivi di telecomunicazione – WAN, LAN, telefoni, computer
  • Sistemi IT e server
  • Infrastruttura e strutture degli edifici
  • Attrezzature specializzate o forniture fondamentali per l’attività

È fondamentale ripristinare questi elementi il prima possibile in caso di interruzione, al fine di riprendere le operazioni e proteggere le risorse.

3. Effettuare una valutazione dei rischi e un’analisi dell’impatto sul business

Dopo aver identificato i servizi aziendali chiave, è necessario eseguire una valutazione dell’impatto dei rischi per rilevare le vulnerabilità associate ai sistemi, alle attività e alle risorse essenziali. La valutazione del rischio stima la probabilità di ciascuna minaccia e riflette la probabilità che si verifichi il disastro.

L’analisi dell’impatto sul business (BIA), solitamente condotta insieme alla valutazione del rischio, consente di valutare la criticità e la gravità dell’impatto sulle operazioni aziendali. L’obiettivo principale della BIA è analizzare i costi finanziari e operativi che si dovrebbero sostenere nel caso in cui il rischio si concretizzasse. Aiuta a determinare il livello di tolleranza di processi e dipendenze importanti, come clienti e partner, nel caso in cui le funzioni aziendali chiave fossero compromesse, interrotte o completamente bloccate.

Ecco una tabella semplificata che potete utilizzare come modello per iniziare a redigere la vostra analisi:

Processo aziendale Categoria di impatto Gravità Tempo massimo di inattività tollerabile (MTD) Costi stimati Dipendenze

Si noti che le organizzazioni con più ubicazioni devono eseguire una valutazione dei rischi e una BIA separate per ciascuna ubicazione. Se queste ubicazioni sono geograficamente distanti, le sfide e i rischi potrebbero essere diversi. Un solido piano di continuità operativa tiene conto anche delle relazioni e delle dipendenze tra le diverse ubicazioni.

4. Sviluppare un piano di ripristino

Una volta completati i passaggi precedenti, è il momento di creare un piano di ripristino che ruota attorno al ripristino delle operazioni dopo un disastro. La continuità operativa e il ripristino di emergenza vanno di pari passo, soprattutto perché il piano di ripristino di emergenza (ER) è una parte essenziale del piano di continuità operativa. Per modelli di ripristino di emergenza più dettagliati, scaricate il nostro White paper gratuito Manuale e modelli di ripristino di emergenza.

Il piano di DR delinea i passaggi tecnici che è necessario eseguire per ripristinare i servizi principali il più rapidamente possibile. Tenete presente che il piano di ripristino non si limita ai dati, poiché dovrebbe includere anche macchine, carichi di lavoro e processi.

Il vostro piano di ripristino può sfruttare, tra le altre, le seguenti strategie:

  • Procedure aziendali alternative, ad esempio soluzioni manuali per processi meccanizzati o automatizzati fino al ripristino dei sistemi
  • Un sito secondario o alternativo per riprendere le operazioni aziendali
  • Failover della rete e dei server a livello di sito
  • Ripristino dei backup off-site dei dati critici per l’azienda
  • Risorse “hot-spare” o di standby, che possono essere messe in servizio immediatamente in caso di guasto dei componenti primari

Il video seguente spiega come eseguire un ripristino completo dopo un disastro utilizzando NAKIVO Backup & Replication & Replication.

5. Definire gli obiettivi di ripristino e designare un sito DR

Obiettivo di tempo di ripristino o RTO determina il tempo di inattività del sistema IT che un’azienda può ragionevolmente tollerare prima che i processi o i servizi vengano ripristinati. L’obiettivo di punto di ripristino (RPO) definisce la quantità di perdita di dati che un’azienda può tollerare. Sia l’RTO che l’RPO sono metriche importanti in qualsiasi piano di continuità operativa.

La designazione di un sito di ripristino di emergenza (DR) per il failover di rete/dati è fondamentale poiché fornisce un sostituto immediato nel caso in cui il sito di produzione primario vada offline. Inoltre, aiuta a garantire il raggiungimento degli obiettivi di ripristino.

La struttura DR situata in una ubicazione geografica diversa funge da copia “warm standby” delle risorse, come le VM. In caso di un guasto a livello di sito che mette fuori uso la rete di produzione, il traffico può essere trasferito alla ubicazione DR. Le VM in “warm standby” diventano essenzialmente carichi di lavoro di produzione, ripristinando le operazioni aziendali e garantendo la continuità operativa in modo efficiente.

È possibile utilizzare soluzioni avanzate di protezione dei dati di terze parti per replicare le VM di produzione in una sede DR offsite e impostare l’intervallo di replica in modo che sia in linea con il proprio RPO. La VM replica è una copia esatta della macchina originale e può essere utilizzata in un processo di failover automatizzato durante l’implementazione del piano di ripristino di emergenza.

6. Assicurarsi che tutti i carichi di lavoro critici per l’azienda siano protetti

L’impatto di un disastro può essere notevolmente mitigato proteggendo adeguatamente i dati critici per l’azienda. Rendere i backup resilienti applicando la regola 3-2-1: disporre di almeno 3 backup su 2 diversi tipi di supporti di archiviazione, con almeno 1 copia di backup archiviata offsite.

Eseguire il backup dei dati aziendali seguendo la metodologia di backup 3-2-1 per ottenere gli RPO e gli RTO più brevi possibili. Ciò consente anche di garantire che lo stesso disastro che ha colpito la rete di produzione non possa avere ripercussioni anche sui dati di backup.

7. Testare e aggiornare il piano di continuità operativa

Una volta completato il piano di continuità operativa, è obbligatorio sottoporlo a test rigorosi. Il modo migliore per farlo è formare i dipendenti per assicurarsi che comprendano appieno i loro ruoli e le loro responsabilità. Non è possibile garantire la preparazione alle emergenze senza condurre regolarmente corsi di formazione e esercitazioni. Ancora più importante, mettendo in scena simulazioni complete, è possibile identificare e correggere i punti deboli del piano.

Assicuratevi di eseguire tutte le procedure per riprodurre il flusso di uno scenario di catastrofe reale. È preferibile eseguire questo tipo di test ogni tre mesi, in modo che i membri chiave del team mantengano familiarità con il processo. Inoltre, le modifiche all’Infrastruttura, all’ambiente, ai protocolli, ai carichi di lavoro e/o alla forza lavoro possono introdurre complicazioni nel piano. Questi potenziali intoppi vengono spesso rilevati solo nel corso di prove complete.

Le simulazioni dovrebbero essere osservate da un osservatore indipendente che possa prendere nota di tutte le vulnerabilità. Dopo ogni prova dovrebbe esserci un debriefing, in seguito al quale è possibile redigere un rapporto che documenti le debolezze rilevate e gli aggiornamenti proposti. I rapporti, così come il piano di continuità operativa aggiornato, dovrebbero essere condivisi con tutti i membri del team.

Lista di controllo del piano di continuità operativa

Ecco una lista di controllo semplificata del BCP che consente di seguire le fasi necessarie per garantire la preparazione alle emergenze.

Creare un team di risposta alle catastrofi

  • Assegnare un responsabile senior del BCP
  • Creare un comitato per la continuità operativa
  • Scegliere i membri del team di risposta
  • Definire ruoli e responsabilità
  • Scegliere i delegati secondari per ciascun membro del team
  • Stabilire una comunicazione chiara tra tutti i membri

Identificare i servizi aziendali essenziali

  • Mappare tutti i sistemi di alimentazione
  • Identificare i dispositivi di telecomunicazione
  • Identificare i sistemi IT e i server
  • Identificare le strutture e le attrezzature specializzate
  • Identificare l’interdipendenza tra i servizi
  • Verificare i servizi di emergenza

Condurre una valutazione dei rischi e un’analisi dell’impatto sul business

  • Identificare minacce e vulnerabilità
  • Stabilire la tolleranza al rischio
  • Determinare i processi aziendali critici
  • Calcolare il tempo di inattività massimo tollerabile per ciascun servizio
  • Analizzare l’impatto finanziario, legale, normativo e sui clienti
  • Identificare l’interdipendenza tra le funzioni aziendali critiche

Sviluppare un piano di ripristino

  • Creare un piano di continuità operativa (COOP)
  • Redigere soluzioni manuali alternative per i processi automatizzati
  • Preparazione al failover della rete e del server a livello di sito
  • Test di ripristino dei backup offsite dei dati critici
  • Verifica della disponibilità delle risorse di standby

Definire gli obiettivi di ripristino e designare un sito DR

  • Designare un sito secondario per riprendere le operazioni aziendali
  • Impostare gli obiettivi di punto di ripristino (RPO)
  • Impostare gli obiettivi di tempo di ripristino (RTO)
  • Gestire i processi di ripristino di emergenza

Proteggere i dati critici per l’azienda

  • Eseguire backup dei dati critici per l’azienda
  • Archivia i dati su dispositivi di storage onsite e offsite
  • Archivia backup con protezione air-gap
  • Abilita l’immutabilità per backup specifici

Testare e aggiornare il piano di continuità operativa

  • Esegui test annuali, semestrali e trimestrali
  • Esegui simulazioni BCP complete su base annuale
  • Crea un processo di audit
  • Identificare le vulnerabilità e aggiornare il piano
  • Formare i dipendenti

Conclusione

Una checklist del piano di continuità operativa è essenziale per garantire che i servizi possano continuare a funzionare senza intoppi mentre si ripristinano i carichi di lavoro interessati a seguito di un evento dirompente. Le organizzazioni che non riescono a creare un BCP rischiano di subire gravi interruzioni dell’attività e perdite di dati che possono causare danni finanziari e reputazionali irreparabili.

Questa checklist fornisce il quadro di riferimento per un piano di continuità operativa efficace che può aiutarti a resistere anche agli scenari peggiori. Tieni presente che un BCP non può essere completo senza una soluzione avanzata di protezione dei dati come NAKIVO Backup & Replication. La soluzione NAKIVO include tutti gli strumenti necessari per eseguire processi di backup e ripristino, automatizzare i flussi di lavoro di DR e condurre test di DR che non causano interruzioni per garantire il raggiungimento degli obiettivi di ripristino.

Try NAKIVO Backup & Replication

Try NAKIVO Backup & Replication

Get a free trial to explore all the solution’s data protection capabilities. 15 days for free. Zero feature or capacity limitations. No credit card required.

Le persone leggono anche