Procedure consigliate per demistificare la gestione dei dati non strutturati

I dati non strutturati presentano dei vantaggi e costituiscono la maggior parte dei dati creati e archiviati dalle organizzazioni odierne. Le aziende dipendono dal modo in cui questi dati vengono utilizzati e gestiti. Se i dati critici vengono persi, le organizzazioni possono subire danni finanziari e reputazionali irreparabili. Ecco perché è importante gestire correttamente le informazioni non strutturate e implementare misure affidabili di protezione dei dati. Questo post del blog spiega come gestire i dati non strutturati per migliorare l’efficienza operativa e l’affidabilità.

NAKIVO for NAS Data Backup

NAKIVO for NAS Data Backup

Fast backup and recovery for gigabytes of data on NAS devices and Windows and Linux file shares. Recover whatever you need and whenever you need in seconds.

Dati non strutturati: sfide e impatto sul business

I dati non strutturati non hanno una struttura predefinita come i dati strutturati (database) e presentano delle sfide quando si tratta della loro gestione. I dati non strutturati sono solitamente presentati sotto forma di file, ma anche le e-mail e altri messaggi multimediali possono essere classificati come dati non strutturati.

Volume e varietà: gestire una complessità crescente

Il volume dei dati non strutturati è in continua crescita e la loro gestione sta diventando sempre più complessa. Anche la complessità dei dati aumenta: il numero di formati di file è elevato e non è facile classificare dove sono archiviati i dati critici. Se i file non sono ordinati e denominati correttamente, la gestione dei dati non strutturati diventa ancora più difficile.Grandi volumi di dati non ordinati e non classificati possono portare a una proliferazione dei dati. Se i file temporanei e non necessari non vengono eliminati, consumano spazio su disco aggiuntivo, il che non è razionale. Quando i dati non sono classificati (critici, importanti, poco importanti, temporanei), è difficile selezionare cosa sottoporre a backup. I sistemi di storage dovrebbero essere scalabili per memorizzare i volumi crescenti di dati.

Sfide relative alla qualità e alla provenienza dei dati

I dati non strutturati possono essere obsoleti, irrilevanti, non convalidati, ridondanti, ecc. Questi fattori rendono più difficile la gestione dei dati non strutturati. I processi di elaborazione dei dati sono dinamici e i dati non strutturati vengono spesso migrati tra volumi di disco, file server e repositories. Gli utenti possono modificare questi dati in ogni fase e può essere difficile identificarne la validità e l’autenticità.

Rischi di conformità, sicurezza e governance

Se i dati non strutturati non vengono gestiti correttamente, possono sorgere rischi per la sicurezza relativi ai dati privati, poiché i dati non strutturati contengono solitamente informazioni di identificazione personale (PII). Le organizzazioni devono soddisfare i requisiti di conformità in base alla loro ubicazione geografica e al settore in cui operano. Ad esempio, le organizzazioni che trattano i dati personali dei cittadini dell’Unione Europea devono soddisfare i requisiti di conformità GDPR. Se tali requisiti non vengono soddisfatti, all’organizzazione non conforme vengono applicate multe e sanzioni. Se i dati privati degli utenti non sono adeguatamente protetti, i rischi per la sicurezza possono causare fughe di dati e perdita di dati. In tal caso, l’organizzazione viola i requisiti di conformità, con conseguenze negative. Senza una corretta gestione dei dati non strutturati, è difficile definire quali dati siano sensibili e debbano essere crittografati e protetti. Utilizzo del NAS per l’archiviazione dei dati scalabile e sicura I sistemi NAS (Network Attached Storage) sono ampiamente utilizzati dalle piccole e medie imprese come archiviazione centralizzata per i dati non strutturati. I dispositivi NAS sono comodi, scalabili ed economici. Supportano l’aggiunta di più dischi o l’installazione di dischi di volume maggiore, RAID software per la ridondanza dei dati e opzioni flessibili di condivisione file. Tuttavia, i dispositivi NAS sono destinazioni ambite dai criminali informatici e dai ransomware. In caso di gestione impropria dei dati non strutturati, i ransomware possono accedere ai file non protetti e corromperli crittografandoli in modo irreversibile.

Procedure consigliate per la gestione dei dati non strutturati

Seguite le procedure consigliate di seguito per ottimizzare la gestione dei dati non strutturati e ridurre il rischio di perdita di dati e altre conseguenze negative.

Individuate e catalogate i dati

Individuate tutti i vostri dati archiviati in diverse ubicazioni: file server, dispositivi NAS, data lake, Repository, dati delle applicazioni, e-mail, ecc. Registrare l’ubicazione dei dati, i metadati, lo stato di crittografia, la dimensione dei file, i proprietari, ecc. Raccogliere tutte le informazioni sui dati archiviati consente di ottenere un quadro completo dei tipi e dei volumi di dati. Creare un catalogo dettagliato dei dati rilevati per garantire una visibilità completa. Annotare le categorie di dati, la loro importanza e altri parametri. Potrebbe essere necessario collaborare con più reparti, poiché gli utenti di ciascun reparto sanno quali dati sono importanti per loro. Sulla base delle informazioni raccolte, aggiungere tag e metadati ai file per identificare i dati e migliorare l’organizzazione dei dati non strutturati. Eseguire regolarmente controlli dei dati, poiché questi possono evolversi e cambiare nel tempo. Aggiornare il catalogo/inventario di conseguenza. I vantaggi dell’utilizzo di un catalogo di dati non strutturati sono:

  • Migliorare la governance dei dati: applicare controlli di accesso e criteri di conformità.
  • Migliorare la ricercabilità: gli utenti possono cercare i documenti per parole chiave, tag o proprietari.
  • Prevenire lo storage ridondante dei dati: identificare i file duplicati o obsoleti.
  • Supportare i controlli di conformità: tracciare l’accesso e l’utilizzo dei dati sensibili.

Esempi di dati rilevati ordinati per ubicazione di origine e casi d’uso:

  • Storage on-premise: File server, NAS, desktop/laptop locali
  • Storage sul cloud: AWS S3, OneDrive, Archiviazione BLOB di Azure, Google Drive
  • Applicazioni aziendali: CRM (Salesforce), ERP (SAP), sistemi HR
  • E-mail e strumenti di collaborazione: Outlook, Gmail, Microsoft Teams
  • Multimedia & registri: Filmati CCTV, registrazioni di chiamate, registri degli eventi.

Una volta rilevati i dati, la creazione di un catalogo ricercabile aiuta gli utenti a trovarli e gestirli in modo efficiente. È possibile utilizzare i metadati per organizzare in modo efficace i dati non strutturati. Inoltre, l’aggiunta di etichette strutturate ai dati non strutturati migliora la ricercabilità e la classificazione. Definire cosa devono includere i metadati. La tabella seguente fornisce alcuni esempi di metadati.

Attributo dei metadati Valore di esempio
Tipo di file PDF, DOCX, CSV, MP4
Proprietario Reparto risorse umane, IT, finanza
Data di creazione 2024-12-10
Ultimo accesso 2025-01-15
Conformità GDPR, HIPAA, SOX
Livello di sensibilità Pubblico, Interno, Riservato, Limitato

Classificare i dati per una migliore organizzazione

Classificare i dati per migliorare la gestione dei dati non strutturati: individuare e identificare le informazioni di identificazione personale (PII) e i dati sensibili nel storage. È possibile utilizzare metodi convenzionali come parole chiave e modelli per la ricerca. In alternativa, è possibile utilizzare software avanzati con intelligenza artificiale e algoritmi di apprendimento automatico per analizzare i dati in modo più preciso con opzioni di riconoscimento più approfondite.Dopo aver rilevato i dati, è possibile classificarli in base a:

  • Valore aziendale: critico, importante, non essenziale
  • Livello di sensibilità: pubblico, interno, riservato, limitato
  • Conformità normativa: GDPR, HIPAA, CCPA, ISO 27001
  • Tipo di utilizzo: documenti, immagini, video, registri, e-mail

Stabilire il quadro di classificazione adeguato per la propria organizzazione. Un esempio di classificazione è riportato nella tabella sottostante.

Classificazione Descrizione Esempi
Pubblico Dati non sensibili disponibili a tutti Materiale di marketing, Domande frequenti, relazioni pubbliche
Interno Dati aziendali solo per uso interno Criteri aziendali, e-mail interne
Riservato Dati sensibili che richiedono un accesso controllato Documenti dei dipendenti, relazioni finanziarie
Riservato Dati altamente sensibili con accesso limitato Documenti legali, segreti commerciali, informazioni personali dei clienti

Organizza i dati utilizzando nomi di file e una struttura di cartelle chiari. Organizzare i dati non strutturati in questo modo rende più facile per gli utenti e gli amministratori navigare e identificare i dati. Di seguito è riportato un esempio di cartelle organizzate con file per un reparto finanziario./Finanza /2023 /Bilanci (Riservato) /Fatture (Interno) /2024 /Audit (Riservato) /Bilanci (Riservato) I dati pubblici rimangono nelle cartelle aperte. Il Controllo degli accessi basato sui ruoli (RBAC) e la crittografia proteggono i dati riservati e soggetti a restrizioni.

Stabilire criteri di governance degli accessi

Implementare misure di controllo degli accessi rigorose stabilendo criteri di governance. La governance dei dati gestisce i dati non strutturati controllando chi può accedere, modificare, condividere ed eliminare i dati. I dati non strutturati possono essere sparsi in più ubicazioni di storage (compresi i sistemi on-premise e di storage sul cloud) e i criteri di governance sono importanti per ridurre i rischi di sicurezza.

  • Configurare il Controllo degli accessi basato sui ruoli (RBAC) per garantire che solo gli utenti autorizzati possano accedere ai dati.
  • Seguire il principio del privilegio minimo, che limita l’accesso degli utenti. I dipendenti possono accedere solo ai dati necessari per le loro mansioni lavorative, riducendo il rischio di minacce interne.
  • Considerare l’autenticazione a più fattori (MFA) per l’accesso ai dati critici. L’autenticazione MFA aggiunge un ulteriore livello di sicurezza richiedendo più passaggi di verifica prima di concedere l’accesso.

Ad esempio, un utente del reparto finanziario dovrebbe poter accedere solo ai rapporti finanziari, mentre gli utenti del reparto marketing non dovrebbero avere accesso ai documenti relativi alle buste paga.

  • Assicurarsi che i criteri di governance per la gestione dei dati non strutturati siano in linea con il GDPR, l’HIPAA, il CCPA, il SOX e altre normative e requisiti di conformità.
  • Configurare i criteri per controllare la condivisione dei dati esterni tramite piattaforme cloud come OneDrive, Google Drive, ecc.
  • Valutare la possibilità di configurare criteri per spostare i dati obsoleti in un archivio. Questo approccio libera spazio nell’archivio primario con prestazioni elevate.
  • Utilizzare le seguenti tecnologie per gestire i dati non strutturati:
    • Gestione delle identità e degli accessi (IAM) (Azure Active Directory, AWS IAM) per l’autenticazione e l’autorizzazione degli utenti nel cloud.
    • La prevenzione della perdita di dati (DLP) (Microsoft Purview, Google Cloud DLP) viene utilizzata per il monitoraggio dell’accesso e dei trasferimenti di dati sensibili nel cloud.
    • Gestione degli accessi privilegiati (PAM) per controllare l’accesso ai dati ad alto rischio e agli account privilegiati.
    • Modelli di sicurezza zero-trust per la verifica continua dell’identità dell’utente prima di concedere l’accesso.

Garantire il backup e il ripristino dei dati con soluzioni NAS

Eseguire il backup dei dati archiviati su file server e dispositivi NAS per proteggere i file condivisi e altri dati. Innanzitutto, eseguire il backup dei dati critici necessari per le operazioni quotidiane. Se un dispositivo NAS contiene backup, valutare la possibilità di creare una copia di backup per migliorare la strategia di protezione dei dati e seguire la regola di backup 3-2-1. Testare i backup per garantire che i dati possano essere ripristinati in caso di disastro. Creare un piano di ripristino di emergenza che includa tutti i passaggi obbligatori per ripristinare i dati in diverse situazioni.

Utilizzare l’automazione per il monitoraggio e la gestione dei dati

È possibile automatizzare il monitoraggio e la gestione dei dati per migliorare la sicurezza, la conformità, le prestazioni e l’efficienza operativa. Prendere in considerazione la suddivisione in livelli dello storage per archiviare i dati utilizzati di frequente su uno storage con prestazioni elevate di livello superiore e spostare i file utilizzati raramente su uno storage con prestazioni basse (a basso costo) di livello inferiore. È possibile utilizzare il livello più basso per i dati archiviati. È inoltre possibile configurare criteri di ciclo di vita per spostare automaticamente i dati obsoleti nell’archivio. Il monitoraggio continuo dei dati aiuta a rilevare accessi non autorizzati, problemi di prestazioni e potenziali minacce alla sicurezza. Tracciare i registri di accesso ai dati in tempo reale e i modelli di utilizzo per rilevare attività insolite (ad esempio, l’eliminazione o la modifica di un numero elevato di file in un batch). Configurare avvisi e notifiche automatiche per interagire e risolvere i problemi in tempo. Automatizza il backup dei dati e i flussi di lavoro di ripristino di emergenza. Come NAKIVO semplifica la gestione dei dati non strutturati. NAKIVO Backup & Replication è una soluzione dedicata alla protezione dei dati che supporta il backup di dati non strutturati archiviati su file server, dispositivi NAS e macchine Windows o Linux (server y estación de trabajo). La soluzione NAKIVO supporta il backup di NFS e SMB condivisioni file, particolarmente utile quando si esegue il backup di file condivisi su dispositivi NAS e file server.

Conclusione

La gestione dei dati non strutturati contribuisce a migliorare l’efficienza operativa complessiva e a ridurre vari rischi legati alla sicurezza, alla protezione dei dati e alla conformità. Seguire le procedure consigliate che includono il rilevamento dei dati, la classificazione, il controllo degli accessi, i criteri di governance dei dati e la protezione dei dati. Proteggere i dati non strutturati archiviati on-premise e nel cloud e archiviare più copie di backup in diverse ubicazioni. Utilizzare NAKIVO Backup & Replication per eseguire il backup e il ripristino dei dati in modo efficace.

Try NAKIVO Backup & Replication

Try NAKIVO Backup & Replication

Get a free trial to explore all the solution’s data protection capabilities. 15 days for free. Zero feature or capacity limitations. No credit card required.

Le persone leggono anche