Bonnes pratiques de reprise après sinistre sur AWS
Toute activité susceptible d’avoir un impact négatif sur la continuité des activités d’une entreprise en matière de charges de travail sur site ou dans le cloud peut être qualifiée de catastrophe. Il est essentiel pour une entreprise d’investir du temps et des ressources dans l’identification de tous les risques possibles et dans la définition de plans pour les prévenir, ou au moins pour agir en conséquence afin d’atténuer tout impact négatif. La création d’un plan de reprise après sinistre (DR) complet pour votre infrastructure sur site et votre infrastructure cloud AWS est une priorité absolue. Dans cet article, nous abordons les bonnes pratiques en matière de planification de la reprise après sinistre AWS pour les deux cas, en mettant l’accent sur les charges de travail AWS.
Avantages de l’utilisation d’AWS pour la reprise après sinistre
La plateforme Amazon Web Services (AWS) offre une large gamme de services, notamment le stockage de bases de données, la puissance de calcul, la diffusion de contenu et d’autres fonctionnalités distinctes. AWS peut également être utilisé pour restaurer rapidement les opérations commerciales exécutées sur des machines virtuelles et des instances EC2 en cas de sinistre. AWS vous permet de créer des réplicas et de configurer la reprise après sinistre pour les environnements sur site et dans le cloud. Le stockage des données critiques pour l’entreprise dans le cloud AWS élimine également la nécessité d’un système de stockage physique secondaire, qui entraîne généralement des coûts importants. En effet, vos données à sauvegarder et de réplication peuvent être stockées dans plusieurs régions AWS à travers le monde, de manière sécurisée et fiable. Dans le cadre de sa fonctionnalité de reprise après sinistre, AWS vous active la possibilité d’exécuter et de tester une solution de reprise après sinistre tierce afin de vérifier s’il existe des lacunes (effectuer des tests de reprise après sinistre AWS). Ensuite, vous pouvez utiliser les modèles AWS CloudFormation pour définir les pratiques de reprise après sinistre les plus efficaces et les enregistrer dans un Amazon Virtual Private Cloud pour une utilisation ultérieure.
Scénarios de reprise après sinistre AWS
Amazon propose quatre stratégies de reprise après sinistre AWS. Le choix dépend des besoins et du budget de votre organisation. Diverses combinaisons sont possibles pour répondre aux besoins spécifiques de toute infrastructure virtuelle donnée.
- À sauvegarder et restauration. Les données critiques peuvent être pour sauvergarder et envoyées vers un emplacement hors site, tel que le stockage Amazon S3, où elles sont bien protégées et peuvent être rapidement restaurées si nécessaire. L’interface utilisateur Web d’Amazon S3 le rend accessible from n’importe où. Vous pouvez copier des données directement vers Amazon S3 ou créer des sauvegardes et les stocker dans le cloud. Il s’agit de l’un des scénarios de reprise après sinistre les plus courants dans AWS.
- Voyant lumineux. Ce scénario de reprise après sinistre vous permet de disposer d’une version réduite d’un environnement virtuel dans le cloud, qui reste toujours opérationnel et à jour. Vous pouvez effectuer une récupération rapide et lancer les composants les plus critiques de votre infrastructure basée sur AWS. Des services tels que les images Amazon Machine Images (AMI) et les instantanés Amazon EBS sont utilisés. La méthode du voyant lumineux est plus pratique que la stratégie AWS DR à sauvegarder et à restaurer, car elle réduit considérablement le temps consacré à la récupération.
- Veille active. Dans ce scénario de reprise après sinistre, une version réduite de votre infrastructure de production fonctionne toujours dans le cloud. Lors d’un événement de reprise après sinistre, il peut bénéficier d’une évolutivité rapide afin de minimiser les temps d’arrêt et de restaurer les opérations et les charges de travail critiques.
- Déploiement multisite (« hot standby »). Cette méthode consiste à répliquer les données critiques pour l’entreprise et les composants essentiels de votre infrastructure, puis à les répartir entre plusieurs emplacements sur site ou dans le cloud. Tous ces sites sont actifs ; ils partagent le trafic et les charges de travail. Si une catastrophe touche l’un des emplacements, vous disposez toujours d’un système intact prêt à fonctionner en mode de production complète. Amazon EC2 Auto Scaling est utilisé pour exécuter ce processus. Avec la mise en attente active, les objectifs minimaux de temps de récupération (RTO) et de point de récupération (RPO) sont atteints. Si vous décidez d’utiliser la veille active parmi les scénarios de reprise après sinistre AWS, n’oubliez pas que l’exécution simultanée de plusieurs systèmes virtuels peut s’avérer très coûteuse.
Les fonctionnalités suivantes doivent également être mentionnées dans le contexte de la reprise après sinistre :
- Réplication. Pour garantir une haute disponibilité, la réplication interrégionale peut être mise en œuvre si vos charges de travail principales se trouvent dans le cloud AWS. Ici, les données critiques et les composants système sont répliqués dans n’importe quelle autre région AWS de votre choix. Si des modifications sont apportées à la base de données principale, les données peuvent être mises à jour soit instantanément (réplication synchrone), soit avec un léger retard (réplication asynchrone). Ces deux types de réplication répondent à des besoins commerciaux différents.
- Restauration automatique. Au cours du processus de reprise après sinistre, la charge de travail de l’instance affectée est transférée vers le site cible et l’instance répliquée est mise sous tension (basculement). Une fois le site principal restauré, vous pouvez procéder à la récupération de l’instance d’origine. Pour enregistrer toutes les modifications apportées aux données dans l’instance de reprise après sinistre depuis le basculement, vous devez inverser le flux de réplication des données vers le site principal (restauration automatique).
- Plusieurs régions AWS. Chaque région AWS est une zone distincte et indépendante destinée à stocker soit des instances, soit des données. Pour une reprise après sinistre réussie, vous pouvez choisir de stocker vos données dans deux régions AWS ou plus afin d’atténuer l’impact des catastrophes à très grande échelle.
Bonnes pratiques AWS en matière de reprise après sinistre
Voici les bonnes pratiques en matière de reprise après sinistre AWS, que vous devez garder à l’esprit lorsque vous élaborez un plan de reprise après sinistre AWS pour votre environnement.
- Test de reprise après sinistre AWS. Après avoir installé une solution de reprise après sinistre, vous devez la tester. Les tests peuvent être exécutés sur demande ou planifiés. Vous pouvez vous entraîner à effectuer des « tests le jour J », qui consistent à tester vos applications et vos instances afin de vérifier que votre plan de reprise après sinistre fonctionne comme prévu et que les RTO peuvent être respectés. À cette fin, AWS CloudFormation peut être utilisé pour le déploiement d’environnements complets sur Amazon EC2. Vous pouvez créer un modèle de ressources qui vous permet de modéliser et de gérer les composants d’infrastructure dans votre environnement cloud. Diese tests périodiques permettent zu überprüfen, dass alle DR-Komponenten korrekt geplant und organisiert sind und dass Ihre RTOs und RPOs bei Bedarf erreicht werden können.
- Surveillance et alerte. Pour éviter qu’une catastrophe éventuelle ne détruise votre infrastructure, vous devez identifier rapidement les problèmes potentiels. Vous pouvez surveiller régulièrement le flux de travail de votre système et vérifier son intégrité. Cela vous permet de détecter rapidement les menaces émergentes telles que les problèmes de connectivité, les pannes de serveur ou les arrêts d’applications. Amazon CloudWatch évalue les performances de vos ressources AWS. Des alarmes et des notifications peuvent être configurées pour vous avertir lorsque certaines mesures atteignent un niveau critique.
- Sauvegardes et réplication régulières. Avant qu’une catastrophe ne survienne, il est essentiel de préparer votre système et d’effectuer régulièrement des tâches de sauvegarde et des réplications. Vous disposez ainsi d’une bonne cible pour le basculement. Après être passé à votre environnement de reprise après sinistre, vous devez continuer à exécuter régulièrement des tâches de sauvegarde et de réplication. Le stockage de ces sauvegardes et répliques dans des emplacements distants distincts vous permet d’éviter le risque d’avoir un point de défaillance unique. AWS peut effectuer régulièrement des tests de reprise après sinistre afin de vérifier l’état de votre infrastructure de reprise après sinistre.
- Utilisation des outils et techniques AWS. Pour garantir la mise en œuvre des bonnes pratiques AWS en matière de reprise après sinistre, vous devez adopter des groupes de reprise ou des piles d’applications. De cette manière, vous pouvez organiser correctement la récupération de votre infrastructure. Par exemple, les applications critiques pour l’entreprise doivent être récupérées en premier, car elles ont la priorité absolue.
Services de reprise après sinistre AWS
À cette fin, AWS fournit divers services :
- AWS Elastic Reprise après sinistre est un service de réplication des données et de récupération des applications exécutées sur site et dans le cloud. Vous pouvez lancer la récupération d’instances AWS dans le cloud afin de procéder à la récupération des applications sur ces instances.
- AWS Import/Export activé l’accès à des périphériques de stockage portables pour transférer des données et des applications critiques pour l’entreprise vers et depuis AWS. Grâce au réseau interne haut débit d’Amazon, même de grandes quantités de données peuvent être envoyées rapidement et en toute sécurité vers la cible.
- Amazon Elastic Cloud Compute (Amazon EC2) vous permet d’utiliser des ressources informatiques et de créer un centre de données virtuel complet dans le cloud AWS à la demande. Les instances EC2 peuvent être créées en quelques minutes et permettent de conserver un contrôle total pendant toute la durée de la reprise après sinistre.
- Amazon Simple Stockage Service (Amazon S3) est conçu pour stocker et récupérer les données les plus importantes. Ce service conserve les composants essentiels à l’activité sur plusieurs appliances réparties dans plusieurs installations, offrant ainsi le plus haut niveau de disponibilité. AWS assure une protection supplémentaire grâce à la gestion des identités et des accès (IAM), aux politiques de compartimentage, à l’authentification multifactorielle (MFA) et au versionnage des objets.
- Amazon Elastic Block Store (Amazon EBS) est un stockage au niveau des blocs pour les données utilisées avec vos instances Amazon EC2 dans le cloud. Les données sont stockées sous forme d’instantanés qui sont ensuite envoyés vers Amazon S3, garantissant ainsi un stockage fiable et à long terme de vos données.
- Amazon Relational Database Service (Amazon RDS) permet de configurer et de gérer une base de données relationnelle dans le cloud AWS. Il s’agit d’une solution économique et flexible permettant d’effectuer plusieurs tâches d’administration de bases de données.
- Amazon connexion directe vous permet de configurer une connexion dédiée entre un réseau sur site et le cloud AWS. Cela vous aide à assurer la sécurité et à accélérer les connexions réseau sans engager de coûts élevés.
- Accès sécurisé. Lorsqu’elles traitent des données privées et/ou critiques pour leur activité, les organisations, quelle que soit leur taille, doivent impérativement garantir un niveau élevé de sécurité. À cette fin, vous pouvez utiliser AWS Identity and Access Management (IAM), qui garantit un accès sécurisé aux ressources de votre environnement de reprise après sinistre. Avec IAM, vous pouvez créer des politiques de sécurité basées sur les rôles et les utilisateurs qui contrôlent l’accès des utilisateurs aux données critiques.
- Automatisation. L’automatisation de la reprise après sinistre est un aspect important des bonnes pratiques AWS en matière de reprise après sinistre. Lors d’un événement de reprise après sinistre, il est essentiel d’avoir un contrôle total sur vos serveurs basés sur AWS et vos serveurs sur site. Cependant, il est souvent physiquement impossible de superviser manuellement la récupération de chaque application et instance. Pour une gestion efficace, l’orchestration et l’automatisation des processus de reprise après sinistre sont nécessaires. Il existe plusieurs services de gestion Amazon disponibles à cette fin :
- Un ensemble de fonctionnalités incluses dans AWS CloudFormation vous permet de provisionner des services d’infrastructure de manière automatisée.
- AWS OpsWorks permet d’automatiser la configuration, le déploiement et la gestion des serveurs dans vos instances Amazon EC2, ainsi que dans vos environnements informatiques sur site.
- L’évolutivité permet à vos instances d’augmenter ou de réduire leur taille afin de répondre à la demande en fonction des paramètres que vous spécifiez dans AWS CloudWatch. Cela s’avère extrêmement utile lors d’une opération de reprise après sinistre. La solution peut offrir une évolutivité automatique pour répondre à l’augmentation de la charge de travail sur les serveurs et se réduire une fois que les processus de votre infrastructure de production sont revenus à leur état normal.
- octroi de licences. L’installation d’applications sous licence de votre environnement AWS est essentielle pour garantir des performances efficaces. AWS propose différents types de licences, telles que « Licence incluse » et « Apportez votre propre licence », afin de répondre aux besoins spécifiques de votre entreprise. Notez que votre solution de protection des données doit également disposer d’une licence pour une intégration transparente avec AWS.
Solution de reprise après sinistre AWS from NAKIVO
Amazon EC2 est un cloud hautement fiable et sécurisé. Néanmoins, il existe un certain nombre de menaces qui peuvent perturber les performances des instances EC2 et compromettre la continuité des activités. Une solution intégrée dédiée à la sauvegarde et à la reprise après sinistre telle que NAKIVO Backup & Replication peut garantir une fiabilité optimale et la réalisation des objectifs de reprise. La solution NAKIVO peut protéger votre environnement cloud grâce à la sauvegarde et à la réplication d’instances Amazon EC2, vous permettant ainsi de suivre les bonnes pratiques AWS en matière de reprise après sinistre. Les fonctionnalités de reprise après sinistre (DR) de la solution comprennent le basculement automatisé, la restauration automatique, la reprise après sinistre pour orchestrer des séquences DR de toute complexité et des tests DR. Le produit vous permet de créer et de gérer des réplicas de vos instances EC2 d’origine et de les stocker dans un emplacement cible de votre choix. Les réplicas d’instance restent à l’état éteint sur le site de reprise après sinistre et peuvent être facilement mises sous tension lors d’un événement de reprise après sinistre lorsqu’une récupération instantanée est nécessaire. Ainsi, aucun coût supplémentaire n’est engagé pour maintenir en permanence des réplicas d’instances en veille.