Le 10 funzioni principali del clustering di failover di Windows Server 2019: panoramica completa
& Con l’aumentare della domanda di prestazioni ininterrotte, le aziende moderne hanno iniziato a cercare nuovi modi per garantire una disponibilità dei propri servizi pari al 99,999%. La realtà è che la maggior parte delle organizzazioni non può tollerare nemmeno un minimo tempo di inattività, poiché la posta in gioco in termini di perdita di produttività è semplicemente troppo alta. Le potenziali conseguenze di un guasto imprevisto del sistema possono includere la perdita di entrate, opportunità commerciali, produttività e fiducia dei clienti. Anche se si riesce a ripristinare l’operatività dopo ripercussioni così gravi, i tempi di inattività possono comunque influire sulla crescita dell’azienda e influenzare negativamente il futuro dell’organizzazione.
Per mitigare i rischi dei tempi di inattività, è necessario garantire che la propria azienda sia in grado di fornire i propri servizi anche in caso di guasto del sistema o di uno qualsiasi dei suoi componenti. L’approccio definitivo consiste nel creare un ambiente altamente disponibile, il che può essere realizzato garantendo la ridondanza di tutti i componenti del sistema. Esistono vari modi per garantire l’alta disponibilità del tuo ambiente, ad esempio con l’aiuto del backup del server Windows. Un’altra opzione molto diffusa è il clustering di failover.
In questo post del blog descriveremo come funziona il clustering di failover nei server Windows. Inoltre, discuteremo di come la funzionalità di clustering di failover sia stata trasformata con il rilascio di Windows Server 2019. In particolare, forniremo una panoramica delle 10 funzioni principali del clustering di failover di Windows Server 2019.
Nozioni di base sul clustering di failover di Windows Server
Un cluster di failover è un gruppo di 2 o più server (nodi) che lavorano insieme per garantire che i ruoli e i servizi del cluster rimangano altamente disponibili e scalabili in qualsiasi circostanza. Questi nodi in cluster condividono risorse di rete e di storage in quanto possono essere collegati tramite cavi fisici, software o a livello di applicazione. In caso di guasto di un nodo del cluster, i servizi dei nodi guasti vengono assunti dai nodi secondari. Questo processo è noto come failover e può aiutare a ridurre al minimo l’interruzione del servizio, ridurre i tempi di inattività e rispondere al guasto dell’host in modo rapido ed efficiente.
Inoltre, è fondamentale poter controllare lo stato dei nodi in ogni cluster di failover. Utilizzando lo strumento di monitoraggio interno, è possibile verificare che tutti i nodi nel cluster di failover siano funzionanti e in grado di eseguire tutte le funzionalità obbligatorie. In questo modo, è possibile identificare eventuali nodi non funzionanti nel cluster e ridurre il rischio di guasti ai nodi del cluster.
Con Windows Server Failover Clustering, è possibile creare più cluster di failover per garantire un’elevata disponibilità delle applicazioni e dei servizi. Affinché questa funzionalità funzioni, è necessario disporre di due server (attivo e passivo) che condividono lo stesso storage e le stesse reti, oltre a soddisfare specifici requisiti hardware.
Le due macchine possono comunicare utilizzando la funzionalità heartbeat, grazie alla quale si scambiano segnali “heartbeat” tramite una rete dedicata. Si distinguono due tipi di segnali: heartbeat push e pull. Un heartbeat push viene inviato da un server attivo a uno passivo, mentre un heartbeat pull viene inviato da un server passivo a uno attivo. Questi segnali di comunicazione vengono inviati/ricevuti a intervalli regolari. Pertanto, se un “heartbeat” non raggiunge un server al momento previsto, viene identificato un guasto del server e i carichi di lavoro della macchina guasta vengono rilevati dal server di standby.
Per scoprire come rendere il tuo ambiente altamente disponibile e con elevata resilienza ai guasti di sistema, puoi leggere il nostro post sul blog su come abilitare Hyper-V High Availability utilizzando il failover clustering. Per una panoramica più dettagliata di questa tecnologia, è possibile scaricare il nostro eBook che descrive come effettuare l’implementazione di un cluster di failover, quali requisiti devono essere soddisfatti per creare un cluster di failover e come NAKIVO Backup & Replication può garantire la protezione continua dei cluster Hyper-V.
Principali nuove funzionalità del clustering di failover per Windows Server 2019
Gli sviluppatori Microsoft hanno lavorato incessantemente su ciascuna delle sue versioni aggiungendo nuove funzioni e migliorando quelle esistenti. Il rilascio di Windows Server 2019 non fa eccezione. Tra i numerosi miglioramenti, come l’integrazione del cloud ibrido, i livelli avanzati di sicurezza o l’iperconvergenza, questo sistema operativo porta anche la funzionalità di clustering di failover a un livello superiore. Di seguito è riportato un elenco completo delle nuove funzioni di Windows Server 2019 e di come hanno trasformato la funzionalità Failover Clustering.
Migrazione di cluster tra domini
Il processo di migrazione di cluster tra domini era un’operazione complessa e dispendiosa in termini di tempo. I nodi e i cluster non potevano essere semplicemente spostati tra domini diversi. Questo processo richiedeva una riconfigurazione obbligatoria dei cluster di failover, con conseguenti interruzioni indesiderate del servizio e tempi di inattività considerevoli. Con Windows Server 2019, è finalmente possibile migrare i cluster di failover da un dominio Active Directory a un altro. Garantendo un consolidamento dei domini rapido e semplice, è possibile risparmiare tempo, fatica e risorse.
Miglioramenti ai volumi condivisi del cluster
La cache dei volumi condivisi del cluster (CSV) consente l’allocazione della memoria di sistema come cache write-through, che permette la memorizzazione nella cache di I/O non bufferizzati di sola lettura. Grazie a questa funzionalità, è possibile migliorare le prestazioni delle VM Hyper-V, che sfruttano I/O non bufferizzati quando accedono ai dischi rigidi virtuali. La cache CSV è disponibile in Windows Server 2019 per impostazione predefinita, garantendo una migliore produttività e prestazioni più veloci delle VM in esecuzione sui volumi condivisi del cluster. Altri miglioramenti CSV includono una logica migliorata per rilevare eventuali problemi nel cluster e la sua riparazione tempestiva. Questa funzionalità funziona grazie al rilevamento del percorso di rete del cluster e ai nodi partizionati.
Cluster compatibili con Azure
Windows Server 2019 è stato progettato per l’integrazione perfetta delle funzionalità ibride nel data center. Inoltre, i cluster di failover di Windows sono compatibili con Azure, il che significa che possono identificare automaticamente quando sono in esecuzione all’interno di Azure. Di conseguenza, i cluster di failover di Windows possono ottimizzarsi automaticamente, garantendo il failover proattivo e la registrazione degli eventi di manutenzione pianificata di Azure. Per avviare il sistema, non è più necessario eseguire il noioso processo di riconfigurazione del bilanciatore di carico con nome di rete dinamico.
Testimone di condivisione file USB per quorum
La funzionalità heartbeat sopra menzionata consente di controllare lo stato di ciascun nodo nel cluster. Tuttavia, in caso di guasto imprevisto della rete, i nodi del cluster non saranno in grado di comunicare tra loro. Ciò comporta lo scenario split-brain in cui ciascuno dei nodi presume di essere l’unica istanza funzionante nel cluster e inizia a funzionare contemporaneamente. Sfortunatamente, ciò può causare il danneggiamento dei dati o vari tipi di conflitti di dati.
La tecnologia del quorum è stata progettata per risolvere questo problema. Il cluster costringerà uno dei nodi a interrompere l’esecuzione in base alla maggioranza dei voti. Tuttavia, se nel cluster è presente un numero pari di nodi (ad esempio un cluster a due nodi), i membri del cluster potrebbero non riuscire a raggiungere il quorum e a determinare quale dei nodi debba continuare a funzionare. Di conseguenza, il cluster smette di funzionare del tutto.
Con Windows Server 2019, è possibile utilizzare un’unità USB collegata a un dispositivo di rete standard come testimone per il quorum del cluster di failover. In questo caso, anche il testimone USB ha diritto di voto e può fornire un voto decisivo per evitare lo scenario split-brain .
Testimone di condivisione file aggiornato per scenari di quorum
Con il rilascio di Windows Server 2019, il meccanismo di voto del quorum è diventato ancora più tollerante ai guasti. Il File Share Witness aggiornato può essere utile nei seguenti casi:
- Quando non è possibile accedere a un cloud witness a causa di una connessione Internet lenta o assente.
- Quando non sono disponibili unità condivise per un disco witness.
- Quando il cluster di failover è in esecuzione in una zona demilitarizzata (DMZ), dove la connessione al controller di dominio non è disponibile.
- Quando si dispone di un cluster di gruppo di lavoro o di dominio misto senza un oggetto nome cluster (CNO) di Active Directory.
In tutti questi scenari, la procedura di voto del quorum può fallire, causando l’arresto del cluster di failover. Con Windows Server 2019, questi potenziali rischi sono stati risolti, consentendo di utilizzare il testimone di condivisione file in quasi tutti gli scenari.
Set di cluster
Un’altra funzionalità aggiunta di recente a Windows Server 2019 è quella dei set di cluster. Un cluster set comporta il raggruppamento di più host di cluster di failover di Windows Server (di calcolo, storage e iperconvergenti) in un insieme logico di cluster. I cluster set possono semplificare notevolmente la gestione dei cluster di failover nella vostra infrastruttura in diversi modi. In questo modo, potete migrare facilmente le VM tra i cluster di failover in esecuzione in un unico cluster set. Inoltre, questa funzione può rendere i cluster più resilienti ai guasti, poiché ora è possibile eseguire il failover tra i cluster, garantendo un’interruzione minima del servizio.
Aggiornamento cluster-aware per Storage Spaces Direct
La funzione di aggiornamento cluster-aware è stata introdotta per la prima volta con Windows Server 2012. Cosa può fare questa funzionalità? Con l’aggiornamento cluster-aware, è possibile aggiornare automaticamente i server in cluster con una perdita minima di disponibilità. Con il rilascio di Windows Server 2019, questa funzionalità può essere integrata con Storage Spaces Direct (S2D), consentendo la risincronizzazione automatica dei dati su ciascun nodo durante il processo di aggiornamento. Inoltre, l’aggiornamento cluster-aware è in grado di rilevare dopo quali aggiornamenti è obbligatorio riavviare il sistema. Pertanto, i riavvii verranno eseguiti solo quando necessario, riducendo significativamente i tempi di inattività dell’azienda.
Autenticazione del cluster di failover di Windows Server 2019
Anche i cluster di failover sono esposti a varie minacce alla sicurezza. Nelle versioni precedenti di Windows Server, l’autenticazione NTLM richiedeva di affrontare questo problema. Con il rilascio di Windows Server 2019, il team Microsoft ha nuovamente migliorato il proprio approccio alla sicurezza. Anziché l’autenticazione NTLM, i nodi del cluster possono comunicare tra loro tramite autenticazione basata su certificati e Kerberos. In questo modo, è possibile impedire lo spooning del traffico di rete e rendere i cluster di failover più resistenti agli attacchi di sicurezza improvvisi.
Cluster di failover con riparazione automatica
Windows Server 2019 rafforza la resilienza e la disponibilità della rete del cluster aggiungendo la funzionalità di riparazione automatica. Un cluster con riparazione automatica può controllare regolarmente lo stato dei propri nodi e ripararli (risolvere i problemi) tempestivamente se vengono rilevati dei problemi. Ad esempio, se un nodo si guasta e non è in grado di comunicare con il resto del cluster, il cluster rileva automaticamente il problema, tenta di riparare il nodo guasto e lo ricollega al cluster. Questa funzionalità può ridurre significativamente il carico di gestione che gli amministratori di sistema devono sostenere, oltre ad aumentare le capacità di alta disponibilità.
Rafforzamento del cluster
Un’altra funzione di sicurezza disponibile in Windows Server 2019 è il rafforzamento del cluster. I nodi all’interno del cluster possono comunicare tramite Server Message Block (SMB) per i volumi condivisi del cluster e gli spazi di archiviazione diretti utilizzando l’autenticazione basata su certificati. Ciò consente livelli di sicurezza più elevati nella comunicazione all’interno del cluster.
Protezione dei dati con NAKIVO Backup & Replica
L’obiettivo principale del clustering di failover è garantire il massimo livello di disponibilità dell’infrastruttura. Il clustering failover di Windows può essere giustamente considerato una tecnologia essenziale per i moderni data center che devono garantire la fornitura continua dei servizi. Grazie a questa funzionalità, è possibile evitare tempi di inattività non pianificati e mantenere lo stesso livello di produttività aziendale in quasi tutte le circostanze.
Tuttavia, è comunque necessario sviluppare una strategia completa di protezione dei dati in grado di rispondere ai rischi per la sicurezza e prevenire il verificarsi di potenziali disastri. NAKIVO Backup & Replication è una soluzione affidabile e conveniente in grado di garantire una protezione dei dati robusta in diversi modi.
- Con la soluzione di backup NAKIVO, è possibile eseguire backup nativi, basati su immagini e coerenti con le applicazioni di VMware, Hyper-V, VM Nutanix AHV, istanze di EC2 e server fisici Windows e Linux.
- La funzionalità di copia di backup può aggiungere un ulteriore livello di protezione contro il danneggiamento imprevisto dei dati, i guasti del sistema o i disastri. È possibile creare copie dei backup esistenti e inviarle offsite o su cloud pubblici. Inoltre, è possibile creare una copia mirror del repository di backup o semplificare l’intero processo di copia del backup.
- Automatizzate le vostre attività di protezione dei dati utilizzando Protezione dei dati basata sui criteri. È possibile creare più regole di protezione dei dati in base al nome della VM, alle dimensioni, alla posizione, alla configurazione, allo stato di alimentazione della VM, al tag della VM o a una combinazione di questi parametri. Queste regole possono eseguire regolarmente la scansione dell’infrastruttura, identificare le VM che corrispondono ai criteri di protezione dei dati impostati e aggiungerle automaticamente ai relativi processi di protezione dei dati.
- Automatizza e effettua l’orchestrazione del processo di ripristino di emergenza dall’inizio alla fine con flussi di lavoro di ripristino del sito. Combinando varie azioni e condizioni in un algoritmo automatizzato, è possibile creare più processi di ripristino del sito per affrontare diversi scenari di emergenza. Inoltre, è possibile testare e aggiornare i processi di ripristino del sito quando necessario senza interrompere l’ambiente di produzione.
- NAKIVO Backup & Replication offre diverse opzioni di ripristino, consentendo di ripristinare istantaneamente macchine virtuali, file e oggetti applicativi direttamente da backup compressi e deduplicati. È inoltre possibile ripristinare macchine virtuali VMware in un ambiente Hyper-V e viceversa utilizzando il ripristino multipiattaforma. Inoltre, NAKIVO Backup & Replication consente di ripristinare macchine fisiche su macchine virtuali VMware o Hyper-V, consentendo il ripristino in quasi tutte le circostanze.

