Comprendre les données obscures et leur rôle dans les risques liés à la sécurité des données
<< Les organisations génèrent et collectent plus de données que jamais, qu'il s'agisse d'interactions avec les clients, de journaux de serveurs, de données issues de capteurs ou de documents internes. Si certaines de ces données sont activement analysées et utilisées, une grande partie reste inexploitée et non examinée. Ces informations négligées sont appelées « données obscures ». Elles peuvent inclure tout type de données, des feuilles de calcul obsolètes aux fichiers journaux inutilisés, souvent stockées sans objectif précis. Si elles ne sont pas gérées, les données obscures représentent non seulement des opportunités manquées en termes d'informations, mais augmentent également les risques en matière de sécurité et de conformité. Lisez cet article pour découvrir ce que sont les données obscures, explorer des exemples courants et comprendre pourquoi il est essentiel de les protéger. Qu'est-ce que les données obscures ? Les données obscures sont des informations qu'une organisation collecte, traite et stocke dans le cadre de ses activités commerciales habituelles, mais qu'elle n'utilise pas activement à des fins significatives. Il s'agit d'informations numériques inutilisées, inexploitées ou non analysées qui se trouvent dans des systèmes, des sauvegardes du système ou des stockages. Elles sont qualifiées de « sombres » car elles restent cachées. Caractéristiques principales Le phénomène d'accumulation de données obscures se produit parce que les organisations pensent que toutes les informations qu'il est possible de capturer doivent être stockées, car elles pourraient un jour leur être utiles. Dans la pratique, ces données restent inutilisées dans la plupart des cas, car sans métadonnées appropriées, il est difficile de récupérer des informations spécifiques, en particulier si le format des données n'est pas structuré et ne peut être récupéré à l'aide d'une requête. Les données obscures peuvent entraîner un gaspillage d'espace de stockage et des opportunités manquées. Elles sont comme un encombrement numérique, souvent ignoré, mais potentiellement risqué et précieux. Une gestion appropriée peut réduire les menaces pour la sécurité, permettre de réaliser des économies et révéler des informations cachées. Caractéristiques clés des données obscures Caractéristique Description Collectées mais non utilisées Générées ou recueillies dans le cadre des activités commerciales, mais jamais analysées ni utilisées. Stockées à long terme Souvent conservées pour des raisons de conformité, par habitude ou par manque de gestion des données, et non parce qu'elles ont de la valeur. Risque non identifié Peut contenir des informations sensibles ou réglementées (informations personnelles identifiables, propriété intellectuelle, données financières) qui présentent un risque pour la sécurité/la conformité en cas de violation. Coût caché Consomme des ressources de stockage, de sauvegardes et de gestion sans offrir de retour sur investissement. Potentiel inexploité Peut contenir des informations précieuses pour la veille économique, l'IA/ML ou l'amélioration des opérations. Données obscures, non structurées et obsolètes Expliquons la différence entre les données obscures, non structurées et obsolètes. Les données obscures sont collectées mais jamais utilisées. Données non structurées ne possèdent pas de structure prédéfinie et peuvent être utilisées ou non. Données obsolètes étaient utiles, mais sont désormais dépassées. Ces types de données peuvent se chevaucher. Une grande partie des données obscures sont non structurées, et certaines données non structurées peuvent être obsolètes. Cependant, toutes les données non structurées ou obsolètes ne sont pas obscures. Les trois types de données sont comparés dans le tableau ci-dessous : Fonctionnalité / Type Données obscures Données non structurées Données obsolètes Définition Données collectées non utilisées Données sans modèle ou schéma prédéfini Données obsolètes qui ne sont plus pertinentes Format Peut être structuré, semi-structuré ou non structuré Généralement non structurés (adresses e-mail, images, vidéos) Peut être n'importe quel format Utilisation Non utilisé activement, simplement stocké Souvent utilisé activement ou analysé Anciennement utilisé mais désormais abandonné Risques Risques cachés liés à la conformité, à la sécurité ou aux coûts Difficile à gérer et à sécuriser à grande échelle Vulnérabilité aux fuites, encombrement du stockage Valeur potentielle Élevé si analysé correctement Élevé si organisé et structuré Faible ou aucune, la valeur a expiré Pourquoi les données deviennent obscures Les données deviennent obscures lorsqu'elles sont collectées mais jamais utilisées, analysées ou gérées efficacement. Cette situation est généralement due à une combinaison de problèmes techniques, organisationnels et stratégiques. Les données sont générées automatiquement . Les systèmes, les applications, les capteurs et les journaux produisent en permanence de grandes quantités de données. La plupart de ces données sont capturées de manière passive (comme les journaux de serveur ou la télémétrie) sans qu'il soit prévu de les analyser. Manque de sensibilisation ou de visibilité . Souvent, les organisations ne savent pas quelles données elles possèdent, où elles sont stockées ni ce qu'elles contiennent. Les données peuvent être dispersées entre différents services, systèmes hérités ou plateformes cloud, invisibles pour les décideurs. Mauvaise gestion et gouvernance des données . En l'absence de politiques de classification, de cycle de vie ou d'utilisation, les données sont stockées sans objectif précis. Cela se produit lorsqu'aucun audit régulier ne permet de déterminer ce qui est encore utile ou nécessaire. Dans ce cas, les données peuvent devenir désorganisées et inutilisables. Certaines organisations ne disposent pas de spécialistes informatiques dédiés ou de l'expertise nécessaire pour travailler avec les données obscures. Silos commerciaux et fragmentation . Les données sont enfermées dans des silos départementaux, ce qui les rend inaccessibles à ceux qui pourraient en tirer profit. Cela se produit lorsque les départements collectent et stockent les données de manière indépendante. Les équipes peuvent ne pas partager les informations ou même ne pas se rendre compte qu'elles ont des besoins similaires en matière de données. Systèmes hérités et habitudes de stockage . Les anciens systèmes archivent les données « au cas où » et les conservent indéfiniment sans les examiner. Au fil du temps, ces données archivées sont oubliées ou deviennent inutiles. Les priorités commerciales peuvent changer et les données qui étaient activement utilisées auparavant peuvent devenir moins pertinentes lorsque les priorités d'une organisation changent. Manque d'outils ou de compétences pour analyser les données . Les organisations peuvent manquer d'outils, de personnel ou de stratégie pour exploiter et traiter des jeux de données volumineux ou complexes. Cela est particulièrement vrai pour les données non structurées telles que les images, les fichiers audio et les vidéos. Si les ressources sont limitées, une organisation peut donner la priorité à la collecte de données plutôt qu'à leur analyse. Coût ou risque lié à l'analyse des données . Le traitement et l'analyse de grands volumes de données peuvent être coûteux. Dans les secteurs réglementés, l'analyse de données anciennes peut exposer à des risques de non-conformité et, par conséquent, celles-ci ne sont pas exploitées. Manque de valeur perçu . Les équipes peuvent ne pas voir l'utilité commerciale évidente de certains types de données. Si les données n'ont pas été collectées dans un but précis, elles sont souvent négligées. Faible coût de stockage . Le coût relativement faible du stockage numérique encourage les organisations à tout conserver, même si cela n'est pas utilisé. Cette approche « enregistrer maintenant, décider plus tard » alimente la croissance des données obscures. Les données deviennent obscures lorsqu'il est plus facile de les stocker que de les comprendre. L'absence de stratégie, de visibilité et d'outils transforme des informations potentiellement précieuses en poids mort numérique, augmentant les coûts et les risques tout en passant à côté d'informations utiles. Types et sources de données obscures Les données obscures peuvent être structurées, non structurées et semi-structurées. Les données structurées sont généralement stockées dans des champs de base de données sous forme de tableaux et peuvent être récupérées à l'aide de requêtes. Les données sensibles, telles que les informations bancaires, les informations médicales et les données clients, sont souvent stockées dans des bases de données, mais elles sont difficiles à classer en raison des autorisations limitées et des conditions à remplir. Les données non structurées sont stockées sans utiliser de bases de données ou de tableurs et ne peuvent pas être analysées efficacement sans conversion. Les adresses e-mail, les fichiers PDF, les documents texte, les enregistrements vocaux et les vidéos de surveillance sont des exemples courants de données non structurées qui peuvent devenir des données obscures. Les données semi-structurées sont non structurées, mais certaines de leurs informations sont définies dans des champs de données. Les pages HTML, les documents XML, les tableaux, les graphiques et les factures sont des exemples de données semi-structurées. Il est possible d'effectuer des recherches partielles et de cataloguer ces données. Les différents types de données obscures peuvent être spécifiques à un secteur d'activité. Vous trouverez ci-dessous des exemples de données obscures. Journaux système et données générées par des machines Ce type de données obscures comprend : Journaux de serveur et d'application Journaux de sécurité (y compris les tentatives de connexion infructueuses) Journaux d'activité du pare-feu et du réseau Télémétrie des appliances Données de capteurs provenant d'appliances industrielles ou intelligentes Données de géolocalisation Journaux de débogage et d'erreurs Interactions avec les clients Les interactions avec les clients constituent un autre type de données non structurées, qui comprennent : E-mails (boîtes de réception, archives, plateformes spécifiques) Journaux de chat du service client ou des bots Enregistrements d'appels (centres de contact, équipes commerciales) Messages vocaux et transcriptions d'enregistrements vocaux Notes et historique CRM Interactions sur les réseaux sociaux Anciennes sauvegardes et archives Cette catégorie de données est un type courant de données non structurées qui comprend : Sauvegardes obsolètes du serveur de fichiers, Sauvegardes VM , etc. Anciens vidages de bases de données Adresses e-mails archivées et boîtes de messagerie Cartouches de bande ou supports de stockage hérités Données d'application obsolètes Versions de documents et fichiers non gérés Dans certains cas, il existe plusieurs versions de documents et de fichiers. Ceux-ci représentent également des données obscures : Versions dupliquées ou obsolètes de feuilles de calcul, présentations et documents Fichiers locaux qui ne sont jamais transférés vers le cloud ou vers un stockage centralisé Fichiers temporaires, sauvegardes automatiques ou brouillons Fichiers sur des disques partagés sans convention de nommage ni contrôle de version Risques et coûts cachés des données obscures Les données obscures présentent des risques et des coûts cachés et souvent sous-estimés pour les organisations. Bien qu'elles semblent inoffensives lorsqu'elles restent inactives sur les serveurs, elles peuvent avoir de graves conséquences financières, juridiques, de sécurité et opérationnelles. Expliquons les risques et les coûts cachés du stockage des données obscures sans Administration appropriée. Menaces et violations de la sécurité Les données obscures contiennent souvent des informations sensibles (informations personnelles identifiables, identifiants de connexion, adresses IP, données financières, etc.) qui ne sont ni protégées ni surveillées. Elles peuvent donc constituer une cible facile pour les cybercriminels. Les pirates peuvent exploiter des archives non corrigées, des partages de fichiers exposés ou des sauvegardes obsolètes. Si elles sont compromises, elles peuvent entraîner des violations de données, des usurpations d'identité ou des cyber-extorsions (ces données peuvent également être vendues/publiées sur des sites de fuite de données du dark web). Les données obscures étant négligées, aucune alerte n'est déclenchée si elles sont consultées ou volées. Les organisations ignorent souvent ce qui a été compromis jusqu'à ce qu'il soit trop tard. Les informations sensibles telles que les mots de passe, les données clients ou les documents internes stockés dans les données obscures peuvent être divulguées ou faire l'objet d'une demande de rançon. Exemples de conséquences négatives : Les sauvegardes d'anciens e-mails qui contiennent les identifiants de connexion des membres de l'équipe sont exposées lors d'une attaque par ransomware. Les adresses e-mail archivées des clients qui contiennent des informations personnelles identifiables sont exposées lors d'une attaque de phishing, entraînant un vol d'identité et une atteinte à la réputation. Risques liés à la conformité réglementaire Le stockage inutile de données obscures peut enfreindre les lois sur la conservation des données ou la confidentialité (telles que le RGPD , HIPAA, CCPA). Ces réglementations exigent que les données soient classées, sécurisées et conservées uniquement pendant la durée nécessaire. Les données obscures contiennent souvent des informations sensibles à caractère personnel ou liées à la santé qui enfreignent les conditions à remplir en matière de conservation ou de chiffrement. Les risques comprennent : Les autorités de réglementation peuvent infliger des amendes aux organisations qui conservent des données plus longtemps que ce qui est autorisé ou qui ne garantissent pas leur sécurité de manière adéquate. La découverte de données obscures au cours d'une procédure judiciaire (eDiscovery) peut exposer les organisations à des risques juridiques inattendus. La conservation de données clients anciennes non classifiées peut entraîner des sanctions pour non-conformité si elles ne sont pas cryptées ou correctement documentées. Les conséquences négatives sont les suivantes : Amendes lourdes, poursuites judiciaires et échecs d'audit. Difficulté à exercer des droits légaux tels que le « droit à l'oubli » (RGPD) lorsque les données obscures ne sont même pas cartographiées. Coûts inutiles de stockage et d'infrastructure L'accumulation de données obscures augmente les coûts pour : Matériel de stockage et espace dans les centres de données Abonnements au cloud, y compris le stockage dans le cloud et les frais de sortie Sauvegarde, réplication et reprise après sinistre systèmes (infrastructure de reprise après sinistre) Refroidissement et consommation d'énergie (pour les serveurs de fichiers et les serveurs de bases de données sur site) Une organisation paie pour stocker, sauvergarder et assurer la sécurité des données qui n'ont aucune valeur. Dans les grandes entreprises, les données obscures peuvent occuper 50 à 80 % du stockage total. Impact sur les analyses et les décisions commerciales Les données obscures encombrent les lacs de données, les entrepôts et les tableaux de bord avec des informations redondantes ou non pertinentes. Cela entraîne des incohérences dans les données, des doublons et une paralysie de l'analyse. Les données obscures ont un impact sur l'analyse par : Rendant les environnements de données encombrés et plus difficiles à naviguer. Ralentissement des recherches, de l'accès aux données et des projets de migration. Créer une confusion quant à la fiabilité des données. Faire perdre du temps aux analystes qui doivent passer au crible des informations non pertinentes ou obsolètes. L'impact négatif des données obscures sur les entreprises : Stratégies produit et ciblage client inadaptés Tendances manquées dans le comportement des clients Prise de décision ralentie en raison du bruit dans les systèmes de données Au fil du temps, les données non entretenues peuvent être corrompues, devenir illisibles ou incompatibles avec les systèmes modernes. Dans un scénario de reprise après sinistre, la restauration d'anciennes données obscures peut échouer ou introduire des erreurs dans les systèmes actifs. Les données obscures peuvent sembler invisibles, mais elles multiplient silencieusement les risques et les coûts. Comment les données obscures affectent la sécurité des données Sans une gestion appropriée, les données obscures peuvent avoir des conséquences négatives sur la sécurité. Ces données peuvent être vulnérables aux cybercriminels en raison d'un manque d'attention administrative, notamment en matière de chiffrement et de protection. Les données obscures élargissent la surface d'attaque . Chaque sauvegarde oubliée, chaque ancienne archive d'adresses e-mail ou chaque fichier non suivi ajoute des points d'entrée potentiels pour les cybercriminels. Plus vous stockez de données (en particulier non protégées), plus les pirates ont d'occasions d'exploiter les vulnérabilités. Par exemple, un serveur FTP mal sécurisé contenant des documents archivés peut devenir le maillon faible d'un système par ailleurs sécurisé. Les données obscures manquent de visibilité et de surveillance . Ces données ne sont généralement pas enregistrées, analysées ou auditées. Elles ne bénéficient pas des logiciels de prévention des pertes de données, des antivirus ou des solutions EDR. Par conséquent, les violations impliquant des données obscures passent souvent inaperçues pendant des mois. Les données obscures contournent les contrôles de sécurité modernes . Les formats et emplacements hérités (tels que les lecteurs de bandes magnétiques ou les anciens dumps SQL) peuvent ne pas être couverts par les politiques de chiffrement, les contrôles d'accès et l'authentification multifactorielle . Par exemple, un ancien dump de base de données RH contenant des mots de passe en clair stockés dans un partage ouvert reste non chiffré et passe inaperçu. Les données obscures créent des risques liés à la conservation des données . Les bonnes pratiques en matière de sécurité recommandent de réduire au minimum la conservation des données, mais les données obscures persistent indéfiniment. Cela augmente la fenêtre d'exposition des données sensibles longtemps après qu'elles aient été utilisées. Même si une cyberattaque se produit aujourd'hui, des données anciennes et inutilisées datant de plusieurs années peuvent être divulguées ou vendues. Les données obscures constituent un angle mort dans la cybersécurité. Vous ne pouvez pas protéger ce dont vous ignorez l'existence, et les pirates misent là-dessus. La découverte des données obscures peut être un point de départ pour une gestion adéquate des données. Comment gérer et réduire les données obscures La gestion et la réduction des données obscures sont essentielles pour améliorer la sécurité, la conformité, la rentabilité et l'intelligence économique. Les pratiques recommandées pour la gestion des données obscures sont expliquées ci-dessous. Découvrez et classez vos données . Utilisez des outils de découverte des données pour analyser les serveurs, le stockage dans le cloud, les bases de données et les ordinateurs. Identifiez l'emplacement, le type de fichier, l'âge, le propriétaire et la sensibilité. Marquez les données par leur pertinence commerciale ou leur catégorie réglementaire. Élaborez une stratégie de gouvernance des données . La gouvernance garantit que chaque donnée a un objectif, un propriétaire et une date d'expiration. Définir des politiques claires pour la gestion du cycle de vie des données : Quelles données conserver Pendant combien de temps (conservation) Qui en est le propriétaire Où elles devraient être stockées Mettre en œuvre les responsabilités en matière de propriété des données dans tous les services. Nettoyer les données héritées . Vérifiez les anciennes sauvegardes, archives et emplacements de stockage. Enlevez les données suivantes : Sauvegardes redondantes ou obsolètes Versions obsolètes des fichiers Bases de données inutilisées Consolidez les données héritées utiles dans des formats structurés et accessibles. Envisagez d'utiliser des règles de conservation des données pour expirer automatiquement et purger les données non pertinentes. Assurez la sécurité des données sensibles non structurées . Cryptez ou restreignez l'accès aux archives de courriels, aux feuilles de calcul, aux fichiers PDF et aux fichiers audio/vidéo. Appliquez des contrôles d'accès, une gestion des versions et une journalisation des audits. Même les données inutilisées doivent être protégées jusqu'à ce qu'elles soient examinées ou enlevées. Mettez en place des tâches régulières de gestion des données . Planifiez des examens trimestriels des données inutilisées, des audits annuels du stockage et des analyses DLP régulières. Formez les utilisateurs à la bonne gestion des données et encouragez-les à adopter une approche « stocker à bon escient ». N'attendez pas une violation ou un audit pour agir ; nettoyez de manière proactive. Optimisez le stockage dans le cloud . Classez les données dans le cloud par niveau d'activité. Automatisez les règles de suppression automatique ou de transfert vers les archives. Évitez la conservation excessive dans les disques partagés ou les magasins d'objets. Les organisations peuvent tirer de sérieux avantages de la transformation des données obscures, malgré les défis que cela représente. Il est recommandé de fournir aux analystes de données un accès aux ensembles de données et de créer des flux de travail automatisés efficaces. Lorsque les données obscures sont analysées, les mesures de performances peuvent être suivies afin de prendre des décisions plus rationnelles en matière d'allocation et d'optimisation des ressources. Comment NAKIVO peut protéger contre les risques liés aux données obscures Les sauvegardes peuvent protéger votre organisation contre les risques liés aux données obscures. Cependant, si elles sont mal gérées, elles peuvent elles-mêmes devenir une source de données obscures. NAKIVO Backup Replication est une solution dédiée à la protection des données qui peut vous aider à protéger votre environnement et à réduire la quantité de données obscures liées aux sauvegardes. Les sauvegardes sont essentielles en termes de gestion des données obscures. Si les données obscures contiennent des informations critiques pour l'entreprise, une sauvegarde sécurisée peut s'avérer vitale lors d'une reprise après sinistre . Au lieu de laisser les données anciennes ou inutilisées encombrer les systèmes de production, transférez les anciennes données vers des sauvegardes cryptées et versionnées ou vers un stockage à froid. Cela permet d'isoler les données obscures tout en préservant l'accès à des fins de conformité ou d'analyse future. Avec les paramètres de conservation avancés , vous pouvez mettre en œuvre des politiques de conservation personnalisées et définir la durée de stockage des données dans le référentiel de sauvegarde . Vous pouvez aligner cette configuration sur les conditions à remplir, telles que le RGPD, en tenant compte du droit à l'oubli. Cela évite que vos sauvegardes ne deviennent des entrepôts de données obscurs. Chiffrement des sauvegardes . La solution NAKIVO prend en charge le chiffrement côté source et côté destination des données sauvegardées. Les sauvegardes cryptées sont mieux protégées contre les accès non autorisés, ce qui réduit les risques de sécurité. Troncature de journaux . Lorsque vous sauvergardez des bases de données MS SQL Server, troncature de journaux vous permet de ne stocker que les données de sauvegarde sans les journaux, ce qui réduit la quantité de données obscures. Immuabilité des sauvegardes . Protégez les sauvegardes contre les modifications et les suppressions par des ransomwares à l'aide de sauvegardes immuables . Cette fonctionnalité réduit les risques liés à la perte de données obscures dans les sauvegardes. Conclusion Sans une gestion adéquate, les données obscures peuvent gaspiller de l'espace de stockage, mais elles peuvent également être utiles pour obtenir des informations commerciales. Suivez les pratiques recommandées en matière d'administration des données et n'oubliez pas de sauvegarder vos données. Les sauvegardes permettent de garantir que même les données obscures sont bien protégées contre la suppression ou la corruption. Utilisez NAKIVO Backup Replication pour une sauvegarde et une récupération fiables et avancées des données. > <> & <>> &