La politique de rétention des sauvegardes GFS expliquée
Idéalement, l’objectif d’une sauvegarde est la récupération de données from n’importe quel moment dans le passé. La manière la plus simple d’y parvenir est d’effectuer des sauvegardes périodiques, généralement quotidiennes. Cependant, même avec des techniques permettant de gagner de l’espace telles que les sauvegardes incrémentielles permanentes, les sauvegardes synthétiques, la compression des données et la déduplication, cette approche nécessite des capacités de stockage illimitées, ce que pratiquement aucune entreprise ne peut se permettre. C’est pourquoi il existe une politique de conservation des sauvegardes, ou un programme de rotation des sauvegardes.
Qu’est-ce que la politique de conservation des sauvegardes GFS ?
La politique de conservation des sauvegardes GFS (Grandfather-Father-Son) poursuit deux objectifs : la minimisation de l’espace de stockage et la maximisation des points de récupération. En termes simples, notre tâche consiste à obtenir le plus grand nombre de points de récupération en utilisant le moins d’espace de stockage possible. Il existe plusieurs schémas de rotation des sauvegardes, plus ou moins complexes et plus ou moins efficaces. Le plus simple est le « premier entré, premier sorti » (FIFO). C’est simple : lorsque l’espace disponible sur le support à sauvegarder est épuisé, la sauvegarde la plus ancienne est supprimée et la nouvelle est écrite à sa place. Le mérite du FIFO réside dans sa simplicité, et son principal inconvénient dans ses limites spatiales. Ainsi, avec le FIFO, vous pouvez stocker un nombre fini de sauvegardes à sauvegarder. En fonction de la fréquence à laquelle vous sauvegardez vos machines virtuelles et de la taille de votre référentiel de sauvegarde, vous pouvez couvrir avec vos sauvegardes un intervalle de temps relativement court. Cependant, cet intervalle de temps est entièrement couvert. Toutes les entreprises ont-elles besoin d’une telle couverture de sauvegarde intégrale ? Bien sûr, il existe certains secteurs, comme les institutions financières ou gouvernementales, où même une perte de données mineure peut s’avérer extrêmement coûteuse. Personne n’aimerait voir son compte bancaire ou sa sécurité annulés à cause d’une panne matérielle dans le centre de données. C’est pourquoi ces organisations dépensent des sommes considérables pour des systèmes de stockage de sauvegarde, des archives sur bande, etc. Cependant, la plupart des entreprises ne sont pas aussi sensibles à la perte de données et peuvent donc mettre en place un système de rotation des sauvegardes qui n’implique pas le stockage des sauvegardes quotidiennes pendant un an. Une telle politique de conservation des sauvegardes permet de trouver un équilibre raisonnable entre la récupérabilité des données et les coûts liés à l’infrastructure de sauvegarde. L’un des plus couramment utilisés est le système de rotation Grand-père-Père-Fils (GFS).
Comment fonctionne le système de sauvegardes GFS ?
Comme dans une famille humaine, un fils est le plus jeune, un père est plus âgé et un grand-père est le plus âgé. Dans le monde des sauvegardes, un fils est la sauvegarde la plus récente from un moment donné, et un grand-père est la plus ancienne. En général, un fils est une sauvegarde quotidienne, un père est une sauvegarde hebdomadaire et un grand-père est une sauvegarde mensuelle. Cependant, vous pouvez ajouter d’autres « parents » entre les deux, comme des sauvegardes horaires, trimestrielles ou annuelles. Par exemple, le système d’exploitation macOS d’Apple intègre un utilitaire de sauvegarde Time Machine qui utilise un schéma de rotation GFS, où le fils correspond à une sauvegarde par heures du système d’exploitation et le grand-père à une sauvegarde mensuelle.
Le schéma GFS classique implique que les « fils » soient à sauvegarder quotidiennement, que les « pères » le soient wöchentlich et que les « grands-pères » le soient mensuellement. Les sauvegardes complètes initiales effectuées le lundi deviennent le premier « père », et les sauvegardes incrémentielles quotidiennes suivantes sont les « fils ». La dernière sauvegarde de la semaine devient la suivante « père ». Les « fils » sont remplacés selon le principe FIFO (premier entré, premier sorti), de sorte que le « fils » le plus ancien est remplacé par la nouvelle sauvegarde incrémentielle, et le cycle se répète. La dernière sauvegarde du mois devient une « sauvegarde historique ». Après cela, les « pères » commencent à tourner par le principe FIFO. Sur la figure ci-dessous, vous pouvez voir quelles sauvegardes sont disponibles à la fin du mois de juin si nous avons commencé à sauvergarder une VM en avril : les éléments bleus représentent les sauvegardes disponibles et les éléments gris représentent celles qui ne le sont pas.
L’un des inconvénients du système GFS est que les sauvegardes plus anciennes deviennent moins granulaires. Par exemple, si vous avez créé un fichier, disons, le lundi de la deuxième semaine de juin, puis que vous l’avez supprimé le jour suivant, il sera irrémédiablement perdu.
Conclusion
En fonction de la stratégie de protection des données de votre organisation, vous pouvez ajouter des sauvegardes horaires, trimestrielles ou annuelles au schéma de rotation GFS. Grâce à d’autres techniques permettant de gagner de l’espace, telles que les sauvegardes incrémentielles permanentes, les sauvegardes synthétiques, la compression et la déduplication des référentiels de sauvegarde, il offre une protection raisonnable des données sans dépenser des sommes astronomiques dans une infrastructure de stockage de sauvegarde.