Utilizzo di Amazon S3 e AWS EC2 come storage di backup sul cloud
>
<> & Amazon fornisce servizi di elaborazione e archiviazione nel cloud. È possibile utilizzare diversi servizi AWS per archiviare i backup nel cloud e garantire la protezione dei dati, tra cui Amazon EC2 e Amazon S3. Tuttavia, questi servizi differiscono per modalità di funzionamento, tipi di dati di backup che possono archiviare e modalità di archiviazione.
Questo post del blog spiega come utilizzare i volumi EBS collegati alle istanze di Amazon EC2 e Amazon S3 per archiviare i dati di backup.
Nota: Questo post non è un confronto completo tra EC2 e S3, poiché EC2 è una piattaforma di cloud computing utilizzata per eseguire carichi di lavoro nel cloud. Si concentra invece su Elastic Block Storage (EBS), utilizzato per archiviare i dati EC2, e lo confronta con S3.
Perché utilizzare AWS per il backup dei dati
Secondo la regola di backup 3-2-1, è necessario conservare almeno tre copie dei dati critici, una delle quali deve essere archiviata offsite. Il storage sul cloud, inclusi Amazon S3 e i volumi EBS nelle istanze di Amazon EC2, può essere utilizzato come archivio offsite per i dati di backup. Ma come e quando utilizzarli? Iniziamo esaminando cosa offrono i due servizi AWS.
- Amazon EC2 (Elastic Cloud Computing) sono VM che girano nel cloud AWS sui server AWS e nei data center AWS. Il contenitore che memorizza i dati delle istanze è chiamato volume EBS (Elastic Block Storage), che è l’equivalente di un disco virtuale.
I volumi EBS sono classificati come storage a blocchi, poiché l’unità di base dell’storage dei dati è un blocco. I volumi EBS sono collegati alle istanze e memorizzano i dati primari di queste istanze. Per i volumi EBS è possibile scegliere tra unità disco rigido (HDD) e unità a stato solido (SSD).
- Amazon S3 (Simple Storage Service) è il servizio di storage oggetti di AWS. Il contenitore utilizzato per archiviare i dati è chiamato bucket. I dati vengono archiviati nei bucket come oggetti e non come blocchi. L’archiviazione basata su oggetti consente l’uso del controllo delle versioni, una funzione utile per il ripristino dei dati.
Utilizzo di Amazon EC2 per il ripristino dei carichi di lavoro
Le istanze di Amazon EC2 possono essere utilizzate per il ripristino nel cloud delle VM locali quando un data center di produzione locale non è disponibile. Per essere preparati a tale scenario, è necessario migrare i carichi di lavoro locali nel cloud utilizzando backup o repliche come parte di un piano di ripristino di emergenza.
In uno scenario di emergenza, la replica su EC2 è preferibile ai backup. Riprendere il funzionamento delle applicazioni e dei server utilizzando le repliche richiede meno tempo rispetto all’utilizzo dei backup (ovvero, un RTO inferiore ). Ad esempio, è possibile replicare database da server on-premise o VM a istanze di EC2 ed eseguire un failover quasi istantaneo quando è necessario ripristinare il sistema dopo un disastro.
I volumi EBS utilizzati dalle istanze di EC2 forniscono uno storage a blocchi ad alta velocità. Di seguito sono riportati alcuni vantaggi e svantaggi dell’utilizzo dei volumi EBS per il backup e il ripristino.
- Vantaggi: EBS può essere utilizzato per carichi di lavoro ad alte prestazioni. I dati possono essere copiati ad alta velocità da un volume EBS a un altro. È inoltre possibile ottenere prestazioni migliori del database con i volumi EBS delle istanze di EC2 rispetto allo storage Amazon S3.
Se è necessario trasferire dati dai server locali (on-premise), la velocità della connessione Internet rappresenta un collo di bottiglia e in questo caso potrebbe essere più razionale utilizzare Amazon S3.
- Svantaggi: Ad eccezione dell’utilizzo dei volumi EBS per il backup di altri volumi EBS, EBS è troppo costoso come destinazione di backup, specialmente per carichi di lavoro diversi dalle istanze di EC2.
Protezione dei dati delle istanze di Amazon EC2 in AWS
Le istanze di Amazon EC2 e i volumi EBS ad esse collegati non vengono sottoposti a backup automatico in AWS. I dati vengono replicati solo tra i server all’interno della stessa zona di disponibilità nei data center Amazon per garantire la ridondanza del data center in caso di guasto del disco o del server (guasto hardware).
Sebbene la funzionalità di backup non sia disponibile, AWS fornisce tre metodi nativi per proteggere i dati nelle istanze di EC2:
- Acquisizione di snapshot EBS. Questo è un modo semplice per creare punti di ripristino per i volumi EBS (compresi i volumi EBS crittografati). Gli snapshot possono essere utilizzati per ripristinare i dati su nuovi volumi EBS. Quando si utilizzano gestori di volumi logici come LVM o mdadm, si consiglia di eseguire il backup sul livello del gestore di volumi invece di utilizzare gli snapshot EBS per preservare la coerenza dei dati e dei volumi dei sottocomponenti. Si noti che quando si ripristinano i volumi EBS utilizzando gli snapshot, questi volumi EBS devono essere montati su un’istanza di EC2 preparata.
- Creazione di un’immagine Amazon Machine Image (AMI). L’AMI è un’immagine che contiene il sistema operativo, tutte le impostazioni di configurazione e i dati necessari per l’esecuzione dell’istanza di Amazon EC2. Utilizzando un’AMI, è possibile creare una nuova istanza di Amazon EC2 basata su questa AMI. Questo approccio viene utilizzato per ripristinare le istanze di EC2 e clonarle. Si noti che è necessario prima arrestare un’istanza di EC2 in esecuzione e quindi creare una nuova AMI.
Il vantaggio di questo metodo rispetto all’utilizzo di snapshot dei volumi EBS è che viene ripristinata l’intera istanza di EC2 e non solo i volumi EBS (che devono essere montati manualmente su un’istanza di EC2 creata dopo il processo di ripristino). La configurazione delle immagini AMI da utilizzare per il ripristino richiede più tempo, ma funziona bene in termini di ripristino e scalabilità.
- Copia dell’istanza di EC2 su S3. La copia dei dati memorizzati sui volumi EBS nei bucket Amazon S3 è un metodo alternativo per la protezione dei dati nelle istanze di EC2. Poiché Amazon S3 è un archivio basato su oggetti e Amazon EBS è un archivio a blocchi, per leggere/scrivere file nei bucket S3 è obbligatorio FUSE (filesystem in userspace). FUSE può essere installato sul sistema operativo in esecuzione su un’istanza di Amazon EC2, una VM e un computer fisico per accedere ai bucket Amazon S3.
Tuttavia, quando si tratta di coerenza dei dati, la copia di file in uso da parte di applicazioni (come i database) su S3 può causare il danneggiamento dei dati.
Utilizzo di Amazon S3 per il ripristino dei dati
Amazon S3 offre una funzione di controllo delle versioni per gli oggetti archiviati nei bucket. Per impostazione predefinita, il controllo delle versioni è disabilitato in Amazon S3, ma è possibile abilitare facilmente questa funzione. Quando il controllo delle versioni è abilitato, le versioni precedenti degli oggetti vengono conservate dopo la scrittura delle modifiche. Le modifiche vengono salvate come nuova versione dell’oggetto e gli oggetti eliminati non vengono rimossi in modo permanente.
L’utilizzo di Amazon S3 per l’archiviazione delle versioni presenta vantaggi e svantaggi.
- Vantaggi: Amazon S3 offre diverse classi di storage a prezzi diversi a seconda della frequenza di accesso ai dati e dei tempi di recupero. Amazon offre anche un criterio di prezzi flessibile per l’utilizzo dello storage Amazon S3, che rende S3 accessibile a molti utenti. Scopri di più su Amazon S3 e sul funzionamento di AWS S3, consultando .
Amazon S3 supporta anche il blocco degli oggetti per garantire l’immutabilità dello storage e proteggere gli oggetti da modifiche o cancellazioni indesiderate. Questa configurazione di storage è anche chiamata write once, read many (WORM).
- Svantaggi: Se non si desidera copiare i file manualmente utilizzando l’interfaccia web di AWS, sono necessari strumenti speciali. Inoltre, AWS addebita costi di uscita per i trasferimenti di dati da Amazon S3 (tali costi dipendono dalla quantità di dati trasferiti da AWS e dal livello di storage utilizzato).
Casi d’uso della protezione dei dati Amazon S3
Esistono molti casi d’uso per l’utilizzo di Amazon S3 come destinazione di backup. Considera la possibilità di scegliere questo tipo di storage per:
- Copie dei dati archiviati sui volumi EBS. Come accennato in precedenza, è possibile copiare i volumi EBS utilizzati dalle istanze di EC2 nell’archiviazione Amazon S3.
- Copia dei dati tra bucket S3.
- Backup dei dati archiviati su computer fisici e VM on-premise.
Come proteggere i dati in Amazon S3
È possibile utilizzare diversi strumenti AWS per la protezione dei dati in Amazon S3 dalla perdita. Abilitare e configurare il controllo delle versioni degli oggetti per avere diverse versioni degli oggetti archiviati nei bucket S3 per il ripristino e rivedere gli strumenti disponibili di seguito:
-
Strumenti da riga di comando. Copiare oggetti da un bucket S3 a un altro utilizzando AWS SDK o altri strumenti. È inoltre possibile utilizzare altri strumenti da riga di comando diffusi per Linux e Windows, quali s3cmd, s4cmd e AWS CLI . Installare uno di questi strumenti per trasferire dati da e verso i bucket S3. È inoltre possibile utilizzare questi strumenti da riga di comando per copiare dati tra bucket a scopo di ripristino.
L’utilizzo di script per il backup su S3 è un approccio comune, ma richiede un notevole sforzo. Questo approccio è applicabile per il backup dei dati da bucket S3, istanze di EC2 e VM.
- Vantaggi Gli strumenti CLI e gli script sono disponibili gratuitamente.
- Svantaggi La configurazione della copia dei dati tramite script è complicata. Inoltre, prima di qualsiasi processo di copia, è necessario interrompere l’esecuzione delle applicazioni e l’utilizzo di funzioni quali le istantanee dei volumi all’interno dei sistemi operativi per preservare la coerenza dei dati.
- AWS Storage Gateway. È possibile utilizzare AWS Storage Gateway per trasferire dati da macchine fisiche e virtuali on-premise a bucket Amazon S3.
AWS Storage Gateway è un servizio di archiviazione ibrido distribuito come VM che offre opzioni di cache per un accesso più rapido ai file. Esistono tre tipi di AWS Storage Gateway: un gateway file, un gateway volume e un gateway nastro.
Dopo aver implementato il gateway di archiviazione, è possibile utilizzare protocolli di condivisione standard, come SMB, NFS e iSCSI, per accedere all’archiviazione Amazon S3. AWS Storage Gateway è fornito come virtual appliance per VMware vSphere e piattaforme Hyper-V e può essere scaricato gratuitamente se si dispone di un piano di abbonamento per l’utilizzo di Amazon S3.
Soluzioni per il backup diretto dei dati su AWS
Un modo più efficiente e affidabile per proteggere i dati in AWS è effettuare l’implementazione di una soluzione di protezione dei dati di terze parti che offra l’integrazione con AWS, come NAKIVO Backup & Replication. La soluzione NAKIVO è una soluzione universale per la protezione dei dati che supporta:
- Backup di Amazon EC2. Backup e ripristino coerenti delle istanze di EC2 (su EBS e S3). Non è necessario creare e configurare nuove istanze di EC2 e montare manualmente i volumi EBS ripristinati. È possibile avviare il ripristino di file e oggetti applicativi non appena se ne ha bisogno.
- Replica Amazon EC2. Replicare le istanze di EC2 importanti in AWS e utilizzare le repliche di EC2 in base agli scenari di ripristino dei dati e ai piani di ripristino di emergenza, garantendo un RTO elevato.
- Backup in Amazon EC2. È possibile creare un repository di backup su un’istanza EC2, configurare una connessione di rete tra il proprio data center e la rete utilizzata dalle istanze di EC2 ed eseguire il backup dei dati sull’istanza EC2.
NAKIVO Backup & Replication offre una serie di utili funzioni che rendono la configurazione dei backup su AWS più veloce, comoda e affidabile. Queste funzioni includono:
- Lo storage Amazon S3 con supporto per l’immutabilità può essere utilizzato come destinazione per il backup per proteggere da modifiche indesiderate dei dati, sia accidentali che causate da ransomware.
- Site Recovery consente di automatizzare e effettuare l’orchestrazione dei flussi di lavoro di ripristino di emergenza per le istanze di EC2 e altri ambienti virtuali in base a condizioni e azioni definite. Grazie alla funzione Site Recovery è possibile implementare facilmente scenari complessi di ripristino di emergenza.
- Pianificazione dei processi. È possibile pianificare l’esecuzione automatica dei lavori di backup. Impostazioni di conservazione flessibili consentono di conservare più punti di ripristino per diversi casi di ripristino.
- Il backup coerente con le applicazioni è importante per la coerenza dei dati. NAKIVO Backup & Replication utilizza funzionalità come VSS (Volume Shadow Copy) su macchine basate su Windows per preservare la coerenza dei dati quando le applicazioni (ad esempio, un server di database, Active Directory server, ecc.) eseguono operazioni di scrittura sui file.