Comprendere i dati oscuri e il loro ruolo nei rischi per la sicurezza dei dati
<<> Le organizzazioni generano e raccolgono più dati che mai, dalle interazioni con i clienti e dai log dei server ai dati dei sensori e ai documenti interni. Sebbene alcuni di questi dati vengano analizzati e utilizzati attivamente, gran parte di essi rimane inutilizzata e non esaminata. Queste informazioni trascurate sono note come Dark Data. Possono includere qualsiasi cosa, dai fogli di calcolo obsoleti ai file di log inutilizzati, spesso archiviati senza uno scopo chiaro. Se non gestiti, i dark data non solo rappresentano opportunità mancate di approfondimento, ma aumentano anche i rischi per la sicurezza e la conformità. Leggi questo post per scoprire cosa sono i dark data, esplorare esempi comuni e capire perché è essenziale proteggerli. Cosa sono i dark data? I dark data sono informazioni che un’organizzazione raccoglie, elabora e archivia durante le normali attività aziendali, ma che non utilizza attivamente per scopi significativi. Si tratta di informazioni digitali inutilizzate, non sfruttate o non analizzate che risiedono in sistemi, backup di sistema o storage. Sono chiamati “oscuri” perché rimangono nascosti. Caratteristiche principali Il fenomeno dell’accumulo di dark data si verifica perché le organizzazioni ritengono che tutte le informazioni che è possibile acquisire debbano essere archiviate, poiché potrebbero utilizzarle un giorno. In pratica, nella maggior parte dei casi questi dati rimangono inutilizzati perché, senza metadati adeguati, è difficile recuperare informazioni specifiche, soprattutto se il formato dei dati è destrutturato e non può essere recuperato tramite una query. I dark data possono portare a uno spreco di spazio di storage e a opportunità mancate. Sono come un disordine digitale, spesso ignorato, ma potenzialmente rischioso e prezioso. Una corretta gestione può ridurre le minacce alla sicurezza, risparmiare sui costi e sbloccare informazioni nascoste. Caratteristiche principali dei dark data Caratteristica Descrizione Raccolti ma non utilizzati Generati o raccolti durante le operazioni aziendali ma mai analizzati o utilizzati. Conservati a lungo termine Spesso conservati per motivi di conformità, per abitudine o per mancanza di gestione dei dati, non perché siano preziosi. Rischio non identificato Può contenere informazioni sensibili o regolamentate (PII, IP, dati finanziari) che comportano un rischio per la sicurezza/rischio di conformità in caso di violazione. Costo nascosto Consuma risorse di storage, backup e attenzione della gestione senza offrire un ritorno sull’investimento. Potenziale non sfruttato Possono contenere informazioni preziose per la business intelligence, l’intelligenza artificiale/apprendimento automatico o il miglioramento operativo. Dati oscuri vs dati non strutturati vs dati obsoleti Spieghiamo la differenza tra dati oscuri, non strutturati e obsoleti. I dati oscuri vengono raccolti ma non vengono mai utilizzati. Dati non strutturati non hanno una struttura predefinita e possono essere utilizzati o meno. Dati obsoleti erano utili, ma ora sono superati. Questi tipi di dati possono sovrapporsi. Una grande quantità di dati oscuri è non strutturata e alcuni dati non strutturati possono essere obsoleti. Tuttavia, non tutti i dati non strutturati o obsoleti sono oscuri. I tre tipi di dati sono confrontati nella tabella seguente: Funzione / Tipo Dati oscuri Dati non strutturati Dati obsoleti Definizione Dati raccolti che non vengono utilizzati Dati senza un modello o uno schema predefinito Dati obsoleti che non sono più rilevanti Formato Possono essere strutturati, semi-strutturati o non strutturati Tipicamente non strutturati (e-mail, immagini, video) Può essere qualsiasi formato Utilizzo Non utilizzato attivamente, solo archiviato Spesso utilizzati o analizzati attivamente Utilizzati in precedenza ma ora abbandonati Rischi Rischi nascosti in materia di conformità, sicurezza o costi Difficoltà di gestione e sicurezza su larga scala Vulnerabilità alle fughe di dati, ingombro dello storage Valore potenziale Elevato se analizzato correttamente Elevato se organizzato e strutturato Basso o nessuno, il valore è scaduto Perché i dati diventano oscuri I dati diventano oscuri quando vengono raccolti ma non vengono mai utilizzati, analizzati o gestiti in modo efficace. Questa situazione si verifica in genere a causa di una combinazione di problemi tecnici, organizzativi e strategici. I dati vengono generati automaticamente . Sistemi, applicazioni, sensori e registri producono continuamente grandi quantità di dati. Gran parte di questi dati viene acquisita in modo passivo (come i registri dei server o la telemetria) senza un piano per analizzarli. Mancanza di consapevolezza o visibilità . Spesso le organizzazioni non sanno quali dati possiedono, dove sono archiviati o cosa contengono. I dati possono essere sparsi tra diversi reparti, sistemi legacy o piattaforme cloud, invisibili ai responsabili delle decisioni. Gestione e governance dei dati inadeguate . Senza criteri di classificazione, ciclo di vita o utilizzo, i dati vengono archiviati senza uno scopo preciso. Ciò accade quando non vengono effettuati controlli regolari per determinare quali dati siano ancora utili o necessari. In questo caso, i dati possono diventare disorganizzati e inutilizzabili. Alcune organizzazioni non dispongono di specialisti IT dedicati o delle competenze necessarie per lavorare con i dark data. Silos aziendali e frammentazione . I dati sono bloccati in silos dipartimentali, rendendoli inaccessibili a coloro che potrebbero trarne vantaggio. Ciò accade quando i dipartimenti raccolgono e archiviano i dati in modo indipendente. I team potrebbero non condividere le informazioni o addirittura non rendersi conto di avere esigenze di dati sovrapposte. Sistemi legacy e abitudini di storage . I sistemi più vecchi archiviano i dati “per ogni evenienza” e li conservano a tempo indeterminato senza rivederli. Con il passare del tempo, questi dati archiviati vengono dimenticati o diventano irrilevanti. Le priorità aziendali possono cambiare e i dati che prima venivano utilizzati attivamente possono diventare meno rilevanti quando cambiano le priorità di un’organizzazione. Mancanza di strumenti o competenze per analizzare i dati . Le organizzazioni potrebbero non disporre degli strumenti, del personale o della strategia necessari per estrarre ed elaborare dataset grandi o complessi. Ciò è particolarmente vero per i dati non strutturati come immagini, audio e video. Se le risorse sono limitate, un’organizzazione può dare priorità alla raccolta dei dati piuttosto che alla loro analisi. Costo o rischio dell’analisi dei dati . L’elaborazione e l’analisi di grandi volumi di dati possono essere costose. Nei settori regolamentati, l’analisi di dati obsoleti può comportare rischi di non conformità e, pertanto, tali dati vengono lasciati inalterati. Percezione di mancanza di valore . I team potrebbero non vedere un chiaro utilizzo commerciale per determinati tipi di dati. Se i dati non sono stati raccolti con uno scopo specifico, spesso vengono trascurati. Basso costo dello storage . Il costo relativamente basso dello storage digitale incoraggia le organizzazioni a conservare tutto, anche se inutilizzato. Questo approccio “salva ora, decidi dopo” alimenta la crescita dei dark data. I dati diventano oscuri quando è più facile archiviarli che comprenderli. La mancanza di strategia, visibilità e strumenti trasforma informazioni potenzialmente preziose in un peso morto digitale, aumentando i costi e i rischi e perdendo al contempo informazioni importanti. Tipi e origini di dark data I dark data possono essere strutturati, non strutturati e semi-strutturati. I dati strutturati sono in genere memorizzati nei campi dei database in tabelle e possono essere recuperati utilizzando query. I dati sensibili, come le informazioni bancarie, le informazioni mediche e i dati dei clienti, sono spesso memorizzati in database, ma sono difficili da classificare a causa delle autorizzazioni limitate e dei requisiti normativi. I dati non strutturati vengono archiviati senza utilizzare database o fogli di calcolo e non possono essere analizzati in modo efficace senza conversione. Messaggi e-mail, file PDF, documenti di testo, registrazioni vocali e filmati di videosorveglianza sono esempi comuni di dati non strutturati che possono diventare dark data. I dati semi-strutturati sono non strutturati, ma alcune delle loro informazioni sono definite in campi di dati. Pagine HTML, documenti XML, tabelle, grafici e fatture sono esempi di dati semi-strutturati. È possibile effettuare ricerche parziali e catalogare questi dati. I diversi tipi di dark data possono essere specifici di un determinato settore. Di seguito sono riportati alcuni esempi di dark data. Log di sistema e dati generati da macchine Questo tipo di dati oscuri include: Registri del server e delle applicazioni Registri di sicurezza (compresi i tentativi di accesso non riusciti) Registri delle attività del firewall e delle reti Telemetria dei dispositivi Dati dei sensori provenienti da dispositivi industriali o intelligenti Dati di geolocalizzazione Log di debug e di errore Interazioni con i clienti Le interazioni con i clienti sono un altro tipo di dati non strutturati che includono: E-mail (caselle di posta in arrivo, archivi, piattaforme specifiche) Registri delle chat dell’assistenza clienti o dei bot Registrazioni delle chiamate (centri di contatto, team di vendita) Messaggi vocali e trascrizioni delle registrazioni vocali Note e cronologia CRM Interazioni sui social media Backup legacy e vecchi archivi Questa categoria di dati è un tipo comune di dati non strutturati che include: Backup obsoleti del file server, Backup VM , ecc. Vecchi dump di database E-mail archiviate e cassette postali Cartucce a nastro o supporti di storage legacy Dati di applicazioni obsolete Versioni di documenti e file non gestiti In alcuni casi, esistono più versioni di documenti e file. Anche questi rappresentano dati oscuri: Versioni duplicate o obsolete di fogli di calcolo, presentazioni e documenti File locali sul desktop che non raggiungono mai il cloud o l’archivio dati centralizzato File temporanei, salvataggi automatici o bozze File su unità condivise senza convenzioni di denominazione o controllo delle versioni Rischi e costi nascosti dei dark data I dark data comportano rischi e costi nascosti e spesso sottovalutati per le organizzazioni. Anche se sembrano innocui quando sono inattivi sui server, possono avere gravi conseguenze finanziarie, legali, di sicurezza e operative. Spieghiamo i rischi e i costi nascosti dell’archiviazione dei dark data senza una corretta amministrazione. Minacce e violazioni della sicurezza informatica I dark data contengono spesso informazioni sensibili (informazioni di identificazione personale, credenziali, indirizzi IP, dati finanziari e altro) che non sono protette o monitorate. Pertanto, questi dati possono essere un facile bersaglio per i criminali informatici. Gli hacker possono sfruttare archivi non aggiornati, condivisioni file esposte o backup obsoleti. Se compromessi, possono portare a violazioni dei dati, furti di identità o estorsioni informatiche (questi dati possono anche essere venduti/pubblicati su siti di fuga di dati del dark web). Poiché i dark data vengono trascurati, non vengono attivati avvisi se vengono consultati o rubati. Spesso le organizzazioni non sanno cosa è stato compromesso finché non è troppo tardi. Le informazioni sensibili come password, dati dei clienti o documenti interni archiviati nei dark data possono essere divulgate o oggetto di richieste di riscatto. Esempi di conseguenze negative: I backup delle e-mail legacy contenenti le credenziali dei membri del team vengono esposti in un attacco ransomware. Le e-mail archiviate dei clienti contenenti informazioni di identificazione personale vengono esposte in un attacco di phishing, con conseguente furto di identità e danno alla reputazione. Rischi di conformità normativa L’archiviazione non necessaria dei dark data può violare le leggi sulla conservazione dei dati o sulla privacy (come GDPR , HIPAA, CCPA). Queste normative richiedono che i dati siano classificati, sicuri e conservati solo per il tempo necessario. I dark data contengono spesso informazioni sensibili di natura personale o relative alla salute che violano i requisiti di conservazione o di crittografia. I rischi includono: Le autorità di regolamentazione possono multare le organizzazioni che conservano i dati più a lungo di quanto consentito o che non garantiscono una sicurezza adeguata. Il rilevamento di dati oscuri durante procedimenti legali (eDiscovery) può esporre le organizzazioni a rischi legali imprevisti. La conservazione di dati obsoleti non classificati relativi ai clienti può comportare sanzioni per non conformità se tali dati non sono sottoposti a crittografia o adeguatamente documentati. Le conseguenze negative sono: Multe salate, cause legali e fallimenti degli audit. Difficoltà nell’esercitare diritti legali come il “diritto all’oblio” (GDPR) quando i dark data non sono nemmeno mappati. Costi inutili di storage e Infrastruttura L’accumulo di dark data aumenta i costi per: Hardware di storage e spazio nel data center Abbonamenti cloud, inclusi storage sul cloud e costi di uscita Backup, replica e ripristino di emergenza sistemi (infrastruttura di ripristino di emergenza) Raffreddamento e consumo energetico (per file server e server di database on-premise) Un’organizzazione paga per archiviare, eseguire il backup e garantire la sicurezza dei dati che non forniscono alcun valore. Nelle grandi imprese, i dati oscuri possono consumare il 50-80% dello spazio di storage totale. Impatto sull’analisi e sulle decisioni aziendali I dark data ingombrano i data lake, i data warehouse e i dashboard con informazioni ridondanti o irrilevanti. Ciò porta a incongruenze nei dati, duplicazioni e paralisi dell’analisi. Le informazioni preziose rimangono sepolte, mentre le decisioni aziendali si basano su dati parziali o fuorvianti. I dati oscuri influiscono sull’analisi in quanto: Rendono gli ambienti di dati disordinati e più difficili da navigare. Rallentano le ricerche, l’accesso ai dati e i progetti di migrazione. Causando confusione su quali dati siano affidabili. Facendo perdere tempo agli analisti che setacciano informazioni irrilevanti o obsolete. L’impatto negativo dei dark data sul business: Strategie di prodotto e targeting dei clienti inadeguati Tendenze nel comportamento dei clienti non individuate Rallentamento del processo decisionale a causa del rumore nei sistemi di dati Nel corso del tempo, i dati non sottoposti a manutenzione possono diventare corrotti, illeggibili o incompatibili con i sistemi moderni. In uno scenario di ripristino di emergenza, il ripristino di dati obsoleti e oscuri potrebbe fallire o introdurre errori nei sistemi attivi. I dark data possono sembrare invisibili, ma moltiplicano silenziosamente i rischi e i costi. Come i dark data influiscono sulla sicurezza dei dati Senza una gestione adeguata, i dark data possono portare a conseguenze negative per la sicurezza. Questi dati possono essere vulnerabili ai criminali informatici a causa della mancanza di attenzione amministrativa, compresa la crittografia e la protezione dei dati. I dark data ampliano la superficie di attacco . Ogni backup dimenticato, vecchio archivio di e-mail o file non tracciato aumenta i potenziali punti di accesso per i criminali informatici. Più dati si archiviano (soprattutto se non protetti), più opportunità hanno gli hacker di sfruttare le vulnerabilità. Ad esempio, un server FTP scarsamente protetto con documenti archiviati può diventare un anello debole in un sistema altrimenti sicuro. I dark data mancano di visibilità e monitoraggio . Questi dati solitamente non vengono registrati, scansionati o controllati. Non beneficiano di software di prevenzione della perdita di dati, antivirus o soluzioni EDR. Di conseguenza, le violazioni che coinvolgono i dark data spesso rimangono inosservate per mesi. I dark data aggirano i moderni controlli di sicurezza . I formati e le ubicazioni legacy (come unità a nastro o vecchi dump SQL) potrebbero non essere coperti da criteri di crittografia, controlli di accesso e autenticazione a più fattori . Ad esempio, un vecchio dump del database delle risorse umane con password in chiaro memorizzate in una condivisione aperta rimane non crittografato e inosservato. I dati oscuri creano rischi di conservazione dei dati . Le procedure consigliate per la sicurezza raccomandano di ridurre al minimo la conservazione dei dati, ma i dati oscuri persistono a tempo indeterminato. Ciò aumenta il periodo di esposizione dei dati sensibili molto tempo dopo che sono stati utilizzati. Anche se un attacco informatico avviene oggi, i dati vecchi e inutilizzati degli anni scorsi possono essere divulgati o venduti. I dark data sono un punto cieco nella sicurezza informatica. Non è possibile proteggere ciò che non si sa di avere, e gli aggressori scommettono proprio su questo. Il rilevamento dei dark data può essere un punto di partenza per una corretta gestione dei dati. Come gestire e ridurre i dark data La gestione e la riduzione dei dark data sono fondamentali per migliorare la sicurezza, la conformità, l’efficienza dei costi e la business intelligence. Di seguito sono illustrate le pratiche consigliate per la gestione dei dark data. Individuare e classificare i dati . Utilizzare strumenti di rilevamento dei dati per eseguire la scansione di server di scansione, storage sul cloud, database e computer. Identificare l’ubicazione, il tipo di file, l’età, il proprietario e la sensibilità. Contrassegnare i dati in base alla rilevanza aziendale o alla categoria normativa. Sviluppare una strategia di governance dei dati . La governance garantisce che ogni dato abbia uno scopo, un proprietario e una scadenza. Definire criteri chiari per la gestione del ciclo di vita dei dati: Quali dati conservare Per quanto tempo (conservazione) Chi ne è il proprietario Dove devono essere conservati Attuare le responsabilità relative alla proprietà dei dati in tutti i reparti. Pulizia dei dati legacy . Controllo dei vecchi backup, archivi e ubicazioni di storage. Rimozione dei seguenti dati: Backup ridondanti o obsoleti Versioni obsolete dei file Database inutilizzati Consolidare i dati legacy utili in formati strutturati e accessibili. Valutare l’utilizzo di regole di conservazione dei dati per la scadenza automatica e l’eliminazione dei dati irrilevanti. Proteggi i dati sensibili non strutturati . Crittografa o limita l’accesso agli archivi di e-mail, ai fogli di calcolo, ai file PDF e ai file audio/video. Applica controlli di accesso, controllo delle versioni e registrazione di audit. Anche i dati inutilizzati devono essere protetti fino a quando non vengono revisionati o rimossi. Stabilisci attività regolari di gestione dei dati . Pianifica revisioni trimestrali dei dati oscuri, audit annuali dello storage e scansioni DLP regolari. Forma gli utenti sulla corretta gestione dei dati e incoraggia la mentalità del “memorizzare con uno scopo”. Non aspettare una violazione o un audit; pulite in modo proattivo. Ottimizzate lo storage sul cloud . Classificate i dati cloud in base al livello di attività. Automatizzate le regole di eliminazione automatica o di spostamento nell’archivio. Evitate la conservazione eccessiva nelle unità condivise o negli archivi di oggetti. Le organizzazioni possono ottenere notevoli vantaggi trasformando i dark data nonostante le difficoltà. Si consiglia di fornire agli analisti di dati l’accesso ai set di dati e di creare flussi di lavoro automatizzati efficaci. Quando i dark data vengono analizzati, è possibile monitorare le metriche delle prestazioni per prendere decisioni più razionali in merito all’allocazione e all’ottimizzazione delle risorse. Come NAKIVO può proteggere dai rischi dei dark data I backup possono proteggere la vostra organizzazione dai rischi associati ai dark data. Tuttavia, se gestiti in modo errato, possono diventare essi stessi una fonte di dark data. NAKIVO Backup & Replication I backup sono essenziali in termini di gestione dei dark data. Se i dark data contengono informazioni critiche per l’azienda, un backup sicuro può essere un vero salvagente durante il ripristino di emergenza. ripristino di emergenza . Invece di lasciare che i dati vecchi o inutilizzati ingombrino i sistemi di produzione, sposta i dati vecchi su backup crittografati e versionati o su storage freddo. In questo modo si isolano i dark data, preservando al contempo l’accesso per la conformità o per approfondimenti futuri. Con Impostazioni di conservazione avanzate , è possibile implementare criteri di conservazione personalizzati e definire per quanto tempo i dati vengono archiviati nel repository di backup . È possibile allineare questa configurazione ai requisiti normativi, come il GDPR, tenendo conto del diritto all’oblio. In questo modo si evita che i backup diventino dark data warehouse. Crittografia dei backup . La soluzione NAKIVO offre supporto per la crittografia lato sorgente ( ), lato destinazione ( ) e per i dati di backup ( ) con crittografia. I backup crittografati sono meglio protetti contro accessi non autorizzati, riducendo così i rischi per la sicurezza. Troncamento dei registri . Quando si esegue il backup dei database MS SQL Server, il troncamento dei registri consente di archiviare solo i dati di backup senza i registri, riducendo la quantità di dati oscuri. Immutabilità dei backup . Proteggi i backup dalla modifica e dalla cancellazione da parte di ransomware utilizzando backup immutabile . Questa funzione riduce i rischi legati alla perdita di dati oscuri nei backup. Conclusione Senza una gestione adeguata, i dark data possono sprecare spazio di storage, ma possono anche essere utili per ottenere informazioni commerciali. Seguite le pratiche consigliate per l’amministrazione dei dati e ricordatevi di eseguire il backup dei vostri dati. I backup aiutano a garantire che anche i dark data siano ben protetti contro la cancellazione o il danneggiamento. Utilizza NAKIVO Backup & Replication per un backup e un ripristino dei dati affidabile e avanzato. > <> &> <>< <> &