Gestione dei dati non strutturati: guida alla sicurezza on-premise e nel cloud
Da documenti ed e-mail a video e file di progetto, la maggior parte dei dati critici per la tua azienda è destrutturata e cresce rapidamente. Tuttavia, questi dati spesso non hanno una proprietà, una struttura o una protezione chiare, il che li rende vulnerabili a ransomware, errori umani e rischi di conformità. In questa guida esploriamo le sfide più grandi nella gestione dei dati destrutturati e spieghiamo come proteggere i tuoi dati su NAS, file server e ambienti cloud.
Cosa sono i dati non strutturati?
I dati non strutturati sono informazioni che non seguono un modello di dati predefinito o non sono organizzate in modo sistematico. A differenza dei dati strutturati, che sono disposti in modo ordinato in righe e colonne all’interno di database relazionali, i dati non strutturati sono file memorizzati in file system o object storage. I dati non strutturati possono essere archiviati come testo, audio, foto, video e altri tipi in formati di file specifici. Esempi di dati non strutturati includono:
- Documenti di testo : PDF, DOC, TXT, RTF e altri file.
- Contenuti multimediali , come immagini, video e file audio: RAW, JPG, PNG, TIF, CDR, PSD, AVI, MOV, MPG, MP4, MP3, M4A, WAV e altri formati di file.
- E-mail e messaggi .
- Dati dei sensori e registri .
La maggior parte dei dati generati in tutto il mondo può essere classificata come dati non strutturati, motivo per cui è necessario proteggerli.
Il ruolo del NAS nell’archiviazione e nella gestione dei dati non strutturati
Il Network Attached Storage (NAS) è molto diffuso tra le piccole e medie imprese e gli utenti individuali per l’archiviazione di dati non strutturati come i file. Mentre l’archiviazione di dati strutturati richiede la gestione di un database relazionale che richiede conoscenze avanzate, l’archiviazione di file su NAS è conveniente e pratica. I principali vantaggi dell’utilizzo del NAS per l’archiviazione dei file sono la scalabilità, l’affidabilità e l’accessibilità:
- È possibile aggiungere altri dischi (HDD e SSD) per espandere lo spazio di storage sul NAS. Se non ci sono porte libere per i dischi, è possibile utilizzare unità di espansione.
- La configurazione del software RAID 1 e RAID 10 garantisce la ridondanza dei dati in caso di guasto di un disco rigido, previene la perdita di dati e offre la possibilità di ricostruire l’array utilizzando i dati presenti sui dischi integri.
- È conveniente configurare le condivisioni file per avere un’archiviazione centralizzata dei dati e fornire l’accesso a più utenti, consentendo loro di collaborare in modo efficace. I dispositivi NAS supportano diversi protocolli di condivisione file, come SMB, NFS e AFP, per configurare condivisioni file per Windows, Linux e macOS.
I dispositivi NAS sono convenienti per le piccole e medie imprese rispetto ai sistemi SAN (Storage Area Network) avanzati utilizzati principalmente dalle grandi aziende. In alcuni casi, l’utilizzo del NAS come archivio di dati non strutturati può essere più razionale rispetto all’utilizzo di un file server tradizionale.
Rischi e sfide principali nella protezione dei dati non strutturati
Come qualsiasi altro dato importante, anche i dati non strutturati devono essere protetti. Tuttavia, a causa della loro natura eterogenea, del loro volume e di altre caratteristiche, la configurazione della protezione dei dati non strutturati presenta alcuni rischi e sfide.
Aumento del volume e della complessità dei dati
La quantità di dati generati da un’organizzazione è in continuo aumento, il che significa che è necessario più spazio di archiviazione per i backup dei dati non strutturati. Lo spazio di archiviazione aggiuntivo comporta costi aggiuntivi, quindi è essenziale utilizzare approcci che consentano di ottenere un risparmio di spazio di archiviazione e ridurre al minimo l’archiviazione di dati non necessari. I costi di replica sono più elevati rispetto a quelli di un backup perché la replica richiede prestazioni di storage più elevate, soprattutto se si utilizza la replica in tempo reale. Il potenziamento dei sistemi di produzione richiede anche il potenziamento dello spazio di archiviazione di backup. I dati non strutturati sono costituiti da file in diversi formati e può essere necessario proteggere i dati più critici. Proteggere solo i dati necessari consente di risparmiare tempo e spazio di archiviazione. Ad esempio, potrebbe non essere necessario eseguire il backup dei file di log o temporanei. I dati non strutturati di solito non dispongono di metadati coerenti per classificare e dare priorità a ciò che deve essere sottoposto a backup. I dati non strutturati possono essere archiviati in più posizioni: file server, dispositivi NAS e storage sul cloud. A seconda della posizione dei dati (piattaforma), potrebbero essere necessari approcci diversi per il backup dei dati. Dopo aver apportato modifiche ai sistemi di origine, è possibile regolare la configurazione del backup.
Rischi di perdita di dati e tempi di inattività
Le applicazioni, i servizi e gli utenti utilizzano dati non strutturati che sono importanti per le operazioni regolari. I dati non strutturati sono ampiamente utilizzati nei settori dei media e della sanità, nonché per la collaborazione tra utenti tramite la condivisione di file. La perdita di questi dati può causare tempi di inattività, interruzioni delle operazioni e altre conseguenze negative. Il ritmo di crescita e di cambiamento dei dati non strutturati crea il rischio che alcuni nuovi dati possano rimanere non protetti se l’ Obiettivo di punto di ripristino (RPO) è troppo elevato. I dati non strutturati spesso includono contenuti unici, come documenti, file di progetto, foto, video e altri file importanti. La loro perdita può essere critica per gli utenti e le aziende. Se viene violato un accordo sul livello di servizio (SLA), possono essere applicate delle sanzioni.
Minacce alla sicurezza e rischi per la privacy dei dati
Gli attacchi informatici sofisticati costituiscono una minaccia per i dati non strutturati. In caso di attacco, il ransomware può crittografare i dati, ma il ransomware più pericoloso può rubare i dati caricandoli agli aggressori prima della crittografia. Il ransomware può infettare i computer degli utenti finali e distruggere i file sulle condivisioni file a cui si accede. Gli attacchi ransomware spesso iniziano prendendo di mira gli utenti finali tramite e-mail. Il phishing, il social engineering e altre tecniche sofisticate inducono gli utenti ad aprire file infetti o link dannosi. Il ransomware sfrutta anche le vulnerabilità del software per penetrare in un sistema, infettarlo, diffondersi nella rete e distruggere o crittografare i file. Se il ransomware carica i dati agli aggressori, si tratta di un grave rischio per la privacy, poiché i dati non strutturati spesso contengono informazioni private.
Governance dei dati non strutturati e conformità al GDPR
La conformità agli standard normativi, come il Regolamento generale sulla protezione dei dati ( GDPR ), aggiunge ulteriore complessità alla protezione dei dati non strutturati. È importante identificare i dati sensibili che devono essere protetti per soddisfare i requisiti del GDPR, poiché questi dati possono essere sparsi in più ubicazioni e mescolati con altri tipi di dati. Il GDPR impone la protezione delle informazioni di identificazione personale (PII). I dati non strutturati, come e-mail, contratti e video, spesso contengono PII in formati non strutturati, rendendo difficile la loro individuazione e tracciabilità. I dati non strutturati archiviati in diverse ubicazioni geografiche devono essere conformi alle regole del GDPR sui trasferimenti transfrontalieri di dati, il che complica la conformità. Il GDPR richiede alle organizzazioni di conservare i dati personali solo per il tempo necessario. Applicare i criteri di conservazione ai dati non strutturati è difficile a causa della loro natura disorganizzata. Identificare ed eliminare i dati non strutturati ridondanti o obsoleti per conformarsi al GDPR può richiedere molte risorse. Secondo il GDPR, le organizzazioni devono cancellare i dati personali degli utenti se questi lo richiedono. Le difficoltà nella governance o nella gestione dei dati non strutturati includono la mancanza di metadati per classificare i dati e la proliferazione dei dati a causa dei volumi crescenti. Pertanto, le soluzioni per l’archiviazione e il backup dei dati devono essere scalabili. I dati vengono spesso condivisi all’interno e all’esterno delle organizzazioni, quindi potrebbe essere difficile configurare correttamente il controllo degli accessi per soddisfare tutte le parti e implementare criteri coerenti.
Strategie per Protezione dei dati on-premise
Strategie ottimali di protezione dei dati non strutturati archiviati on-premise possono ridurre al minimo il rischio di perdita dei dati. Queste strategie garantiscono l’integrità, la disponibilità e la riservatezza dei dati, riducendo al contempo i rischi di attacchi informatici, guasti hardware o uso improprio da parte di personale interno. Uno dei punti principali da considerare è la protezione dell’storage dei dati non strutturati.
Backup regolari per protezione dei dati non strutturati
I backup regolari sono un elemento cruciale di qualsiasi strategia di protezione dei dati. È possibile configurare backup automatici da eseguire regolarmente per i dati archiviati localmente su server e dispositivi NAS.
- Determinare la frequenza dei backup in base alla necessità dei dati e alle esigenze organizzative.
- Utilizzare una combinazione di backup completi e incrementali per bilanciare l’efficienza di storage e la velocità di ripristino.
- Seguire la regola di backup 3-2-1 per una strategia di protezione dei dati on-premise efficace e affidabile.
- Testare i backup per garantire che i dati siano coerenti e che sia possibile ripristinarli quando necessario.
- Abilitare la crittografia dei backup per evitare accessi non autorizzati e fughe di dati in caso di attacchi informatici.
- Abilitare l’ immutabilità dei backup per impedire che i backup vengano crittografati, alterati e distrutti dal ransomware.
Procedure consigliate per la sicurezza dei sistemi NAS
I dispositivi NAS sono ampiamente utilizzati come piattaforme di storage per conservare grandi volumi di dati non strutturati on-premise. Allo stesso tempo, i dispositivi NAS sono obiettivi ambiti dai criminali informatici, quindi le organizzazioni devono proteggere i sistemi NAS e i dati archiviati. Seguire le procedure consigliate riportate di seguito può aiutare alla protezione dei dati non strutturati sui dispositivi NAS:
- Disabilitare gli account predefiniti e creare account personalizzati con password complesse per gli amministratori.
- Configurare correttamente le autorizzazioni di accesso.
- Configurare il firewall per garantire che sia possibile accedere al NAS solo da ubicazioni autorizzate per protocolli e porte consentiti. Disabilitare i protocolli non necessari nelle impostazioni del NAS.
- Installare le patch di sicurezza e gli aggiornamenti forniti dal vendor del NAS per correggere le vulnerabilità note.
- Eseguire regolarmente il backup dei dati archiviati sul NAS.
- Assicurarsi che l’ubicazione fisica del dispositivo NAS sia sicura, con accesso limitato solo agli utenti autorizzati.
- Installare gli aggiornamenti di sicurezza non appena vengono rilasciati.
Strategie di governance efficaci per i dati on-premise
Strategie efficaci per la gestione dei dati non strutturati aiutano a gestire i dati in vari formati (documenti, immagini, video, ecc.) garantendo al contempo la sicurezza e la conformità. A causa della natura decentralizzata dei dati non strutturati, l’implementazione di una governance efficace richiede una combinazione di criteri, strumenti e processi.
- Classificare i dati non strutturati in base alla loro sensibilità, al loro valore e ai requisiti di conformità (dati riservati, pubblici, personali).
- Definire categorie come sensibili, riservati e pubblici per dare priorità alle misure di protezione.
- Configurare il Controllo degli accessi basato sui ruoli (RBAC) per limitare l’accesso e garantire che gli utenti accedano solo ai dati di cui hanno bisogno.
- Definire i criteri di conservazione dei dati e di gestione del ciclo di vita. Definire i periodi di conservazione per i diversi tipi di dati non strutturati per garantire che i dati siano conservati solo per il tempo necessario. Allineare i criteri di conservazione ai requisiti di conformità (come GDPR, HIPAA e altri) per evitare problemi legali. Configurare la cancellazione automatica dei dati che hanno superato il periodo di conservazione per ridurre i costi di storage e minimizzare il rischio di esposizione.
- Monitorare l’infrastruttura per rilevare i problemi e risolverli il prima possibile prima che si verifichino guasti gravi. Utilizza sistemi di prevenzione della perdita di dati per rilevare attività anomale correlate alle infezioni da ransomware. Configura notifiche e avvisi automatici.
- Informa i dipendenti sulle minacce informatiche, sulle principali strategie degli attacchi informatici e sui sintomi delle infezioni da ransomware. Se gli utenti sono in grado di rilevare un tentativo di attacco informatico e di intraprendere le azioni corrette, possono contribuire a prevenirlo. Gli utenti devono segnalare comportamenti sospetti che potrebbero indicare un attacco informatico.
- Creare un piano di risposta agli incidenti, un piano di ripristino di emergenza e un piano di continuità operativa . Testare questi piani per assicurarsi che funzionino come previsto in caso di guasti o disastri.
Come proteggere i dati nel cloud ?
Le piattaforme cloud stanno diventando sempre più popolari grazie alla loro affidabilità e disponibilità. Amazon S3 e l’Archiviazione BLOB di Azure sono gli esempi più popolari di archiviazione di oggetti per lo storage di dati non strutturati nel cloud pubblico. Tuttavia, i dati archiviati nel cloud possono andare persi a causa di cancellazioni accidentali, errori umani, errori software o attacchi informatici. Ecco perché è importante considerare la protezione dei dati non strutturati quando si archiviano dati nel cloud pubblico.
Strategie principali per la protezione dei dati nel cloud
Prendete in considerazione le seguenti strategie di protezione dei dati non strutturati per proteggere i dati nel cloud pubblico:
- Utilizzate connessioni crittografate per accedere all’storage sul cloud. Abilitate la crittografia per i file in transito e inattivi. Questa strategia impedisce l’intercettazione dei dati da parte di terzi e le relative fughe di dati.
- Configurare il Controllo degli accessi basato sui ruoli (RBAC). Definire i ruoli e impostare le autorizzazioni per gli utenti. Utilizzare il principio del privilegio minimo e configurare le autorizzazioni degli utenti in modo che possano eseguire solo le attività necessarie. Abilitare l’autenticazione a più fattori per accedere alle risorse cloud. Utilizza strumenti di gestione delle identità e degli accessi (IAM) per creare criteri e gestire le autorizzazioni nei servizi cloud.
- Configura i backup per l’archiviazione di dati non strutturati sul cloud. Sviluppare e testare un piano per il ripristino di emergenza basato sul cloud .
- Assicurarsi che le strategie di protezione dei dati siano in linea con i quadri normativi come GDPR, HIPAA o PCI-DSS, che richiedono misure specifiche per proteggere i dati non strutturati.
- Comprendere il modello di responsabilità condivisa per la sicurezza con il proprio provider cloud. Secondo questo modello, il provider garantisce la sicurezza dell’infrastruttura, mentre il cliente è responsabile della sicurezza dei dati e dell’accesso.
Strumenti nativi per il cloud e automazione
I vendor di storage sul cloud di solito forniscono strumenti nativi che possono essere utilizzati per il ripristino dei dati. Questi strumenti includono Identity and Access Management (IAM), autenticazione a più fattori, crittografia , ACL, firewall e altri.
- Abilita il controllo delle versioni (versione) per ripristinare le modifiche e recuperare la versione precedente dei file se l’ultima versione è danneggiata o sono state scritte modifiche errate.
- Abilitare l’immutabilità utilizzando l’approccio WORM (write-once-read-many) se si utilizza l’archiviazione di oggetti nel cloud.
- Utilizzare livelli di archiviazione per ottimizzare i costi dei dati primari e secondari, nonché dei backup archiviati nel cloud.
- Prendere in considerazione strumenti di gestione del ciclo di vita per la governance dei dati e l’automazione dei dati obsoleti.
- Utilizzare strumenti di monitoraggio nativi del cloud per monitorare i dati archiviati nel cloud e identificare attività anomale.
- Abilitare il sistema di prevenzione della perdita di dati, se fornito dal vendor del cloud.
Garantire la privacy in configurazioni multi-cloud e ibride
Se un’organizzazione archivia i dati in più cloud pubblici o in un cloud pubblico e uno privato (una combinazione di storage on-premise e sul cloud è una configurazione ibrida), dovrebbe implementare misure per garantire la privacy in questo ambiente. Le possibili complessità sono la frammentazione dei dati su piattaforme diverse, i diversi requisiti di conformità e la protezione dei dati in più ubicazioni. La protezione dei dati in ambienti ibridi comprende principalmente la combinazione di misure di sicurezza per ambienti cloud e on-premise.
- Abilitare la crittografia dei dati in tutti gli ambienti. Utilizzare un sistema di gestione delle chiavi (KMS) centralizzato per gestire le chiavi di crittografia. Crittografare i dati prima di trasferirli al cloud utilizzando la crittografia lato client.
- Eseguire il backup dei dati archiviati in tutte le ubicazioni, sia sul cloud che on-premise. Selezionare una soluzione di backup che supporti tutti i provider cloud e le piattaforme locali in cui sono archiviati i dati.
Efficace Gestione dei dati non strutturati e suggerimenti per la governance
I dati non strutturati, come e-mail, documenti, video e altri contenuti multimediali, costituiscono la maggior parte dei dati aziendali, ma spesso mancano di struttura, rendendo più difficile la loro gestione e protezione. L’implementazione di solide strategie di governance e gestione aiuta le organizzazioni a gestire questi dati in modo più efficace. Considerate i seguenti punti quando configurate i controlli di accesso come parte di una strategia di gestione dei dati non strutturati.
- Quali autorizzazioni dovrebbe avere un utente?
- Un utente dovrebbe essere autorizzato a scrivere modifiche?
- È sufficiente fornire a questo utente un accesso di sola lettura?
- Con chi gli utenti sono autorizzati a condividere i contenuti?
- Quali sono i metodi per condividere i dati? Si tratta di una condivisione file su NAS o su una piattaforma di storage sul cloud?
Le organizzazioni dovrebbero essere in grado di controllare l’accesso e l’utilizzo dei dati in modo granulare, oltre a fornire controlli di accesso incentrati sui dati. Queste strategie possono aiutare a prevenire accessi non autorizzati e perdita di dati.
Come NAKIVO semplifica la protezione dei dati NAS
NAKIVO Backup & Replication è una soluzione dedicata alla protezione dei dati in grado di eseguire il backup di dati non strutturati archiviati su file server, dispositivi NAS e nel cloud. La soluzione NAKIVO supporta il backup per condivisione file per NFS e SMB con varie funzioni utili che garantiscono prestazioni elevate e affidabilità.
- Backup automatico delle condivisioni file . Pianificate i lavori di backup per essere sicuri di non perderne nessuno.
- Impostazioni di conservazione flessibili . Configurare i criteri di conservazione per mantenere i punti di ripristino necessari per periodi diversi. Sono supportati lo schema di conservazione GFS e altri schemi di conservazione complessi. È possibile configurare le impostazioni di conservazione per soddisfare i requisiti di conformità obbligatori.
- Crittografia dei backup . Crittografare i backup in transito (durante il trasferimento dei dati sulla rete) e a riposo (in un repository di backup). La crittografia dei backup alla fonte consente di crittografare i backup sul lato sorgente, trasferire i dati crittografati e archiviarli in un repository di backup .
- Backup immutabili . Abilitare l’immutabilità del backup per proteggere i backup da ransomware e altri tipi di modifiche o cancellazioni non autorizzate.
- Funzionalità di risparmio di spazio . Eseguire backup incrementali per copiare solo le modifiche ai dati e ridurre il consumo di spazio di archiviazione. L’esecuzione di backup incrementali con backup completi periodici migliora l’affidabilità e riduce il rischio di danneggiamento della catena di backup incrementali. La compressione dei backup consente di risparmiare più spazio di archiviazione nei repository di backup.
- Posizioni di backup multiple . È possibile archiviare i backup in diverse ubicazioni on-premise e sul cloud. È possibile utilizzare cartelle locali, condivisioni di file SMB/NFS e nastri per l’archiviazione locale. Per un’archiviazione di backup conveniente nel cloud pubblico, è possibile utilizzare l’archiviazione oggetti supportata in Azure BLOB di Azure, AWS S3 e altri archivi compatibili con S3.
- Ripristino granulare . È possibile selezionare file specifici da un backup per ripristinare rapidamente i dati necessari. È supportato anche il ripristino completo.
NAKIVO Backup & Replication & La replica supporta anche il backup per Microsoft 365 , inclusi i dati non strutturati archiviati come e-mail, documenti e altre informazioni in Exchange Online, OneDrive for Business, SharePoint Online e Microsoft Teams.
Conclusione
La protezione dei dati non strutturati richiede l’implementazione di backup per garantire la disponibilità dei dati e ridurre al minimo la possibilità di perdita di dati e tempi di inattività. È inoltre possibile configurare il controllo dell’accesso alla condivisione file per rispettare i requisiti di conformità. Proteggere i backup da accessi non autorizzati utilizzando la crittografia, l’immutabilità e il controllo degli accessi. Utilizzare NAKIVO Backup & Replication per eseguire il backup dei dati non strutturati archiviati su condivisioni file ospitate da file server e dispositivi NAS e nel cloud.