Sauvegarde et archivage des données dans le Cloud AWS

Temps de lecture : 7 minutes

Parmi les sujets traités lors des 80 sessions techniques de l’AWS Summit, celui de la sauvegarde des données a retenu notre attention. A l’heure où les données deviennent une source de valeur essentielle pour l’entreprise, leur sauvegarde est un facteur de pérennité pour l’activité de l’entreprise. Dans cet article, nous approfondirons ce sujet sur deux services en particulier, AWS Backup, qui offre une gestion centralisée des sauvegardes de vos services AWS comme Amazon EBS, Amazon RDS, Amazon DynamoDB, Amazon EFS et AWS Storage Gateway (ce qui vous permet in fine d’externaliser la sauvegarde de vos serveurs On premise) ainsi que l’offre d’un partenaire global N2WS par Veeam.

Cet article fait le lien avec deux conférences :

  • “Sauvegarde et archivage de vos données dans le cloud” par Remi Retureau (AWS).
  • “Continuité d’activité et mobilité Cloud avec Veeam N2WS” par Stéphane Berthaud (VEEAM), Laurent Mombel (N2WS), Laurent Dirson (NEXITY) et Jean Christophe par (NOEVA).

Prémisses de l’externalisation

Pour commencer l’article, il est intéressant de rappeler brièvement comment fonctionnait l’externalisation des sauvegardes avant l’arrivée du Cloud.

Chaque processus et méthode de sauvegarde est différent selon le type et taille de la société. Les serveurs physiques ou serveurs virtuels étaient sauvegardés par le biais d’un logiciel de sauvegarde, puis la sauvegarde était stockée sur un support de stockage sur bande, disques durs, NAS ou pour les gros volumes sur un robot de sauvegardes.

Ces mêmes supports étaient ensuite entreposés dans les locaux de la société dans une salle dédiée, dans une armoire sécurisée ou dans le tiroir de la secrétaire…. A ce stade plusieurs types d’externalisations étaient possibles : le/les duplicatas étaient ensuite emportés chaque soir au domicile d’un des dirigeants par exemple, transportés sur un autre site de la société ou pour les plus grosses structures un service de convoyeur effectuait l’externalisation et le roulement des sauvegardes. Ceci afin de permettre un plan de reprise d’activité (PRA) en cas de dysfonctionnement majeur du site principal.

Pour celles et ceux qui ont eu la chance (ou la malchance) de participer à des processus de rotations de sauvegardes serveur, vous vous remémorez ces doux moments matinaux où vous vous occupiez de lire les reports de sauvegarde, retirer la cassette de la veille puis la ranger dans la valise.

Intégration avec des services de stockages

De nombreux logiciels de sauvegardes (sauvegarde fichiers ou serveurs) disposent maintenant d’intégration vers les fournisseurs Cloud Public. Ces connecteurs permettent donc pour le cas d’AWS de sauvegarder et d’externaliser par le biais d’un flux HTTPS des fichiers locaux vers du stockage objet en ligne comme AWS S3 et de pouvoir appliquer des règles de rétention et définir la classe de stockages utilisés pour ces fichiers (stockage classique, accès peu fréquent ou archivage).

Il existe également d’autres services qui permettent de créer des partages de fichiers (SMB/NFS) qui sont automatiquement répliqués vers AWS S3.

La présentation rappelait l’ensemble des services AWS disponibles liés au stockage et les différents cas d’usages appliqués à chaque type de services.

Vous trouverez plus amples informations techniques dans un article de notre blog suite à l’AWS Summit Paris 2016 avec l’article “Deep Dive S3, le stockage Cloud”.

Pour compléter, il est nécessaire de parler de plusieurs nouvelles classes de stockage sur S3 qu’AWS a introduit début 2019 : S3 Intelligent-Tiering et S3 Glacier Deep Archive.

  • S3 Intelligent-Tiering ou en Français “Hiérarchisation intelligente S3”:

Optimise automatiquement la classe de stockage utilisée vers la classe de stockage la plus économique selon l’usage actuel du Bucket → Accès fréquent et accès peu fréquent, le cas d’usage est pour des fichiers dont vous ne connaissez pas le schéma de stockage ou si vous avez des changements réguliers de type de stockage. À noter qu’il n’y a pas de coût supplémentaire lors de la transition vers une des classes de stockage.

  • S3 Glacier Deep Archive :

Officiellement la classe de stockage la moins cher sur AWS pour de l’archivage long terme et une durabilité élevée avec environs 1$/To stocké. Cette classe de stockage possède les mêmes caractéristiques que Glacier avec une disponibilité (99,99%), répartition sur plusieurs AZ (3) et durabilité (99.999999999%), mais se veut être utilisée pour de l’archivage long terme plus important que Glacier “Classique”. À noter cependant que la durée de stockage minimale est de 180 jours et que le délai de récupération est de 12h.

Centralisation de la gestion des sauvegardes avec AWS Backup

AWS Backup, sorti en janvier 2019, est un service conçu pour manager les sauvegardes de ressources AWS avec une seule interface.

Ce service permet de piloter et d’unifier l’ensemble des sauvegardes sur le compte en un seul service pour planifier les cycles de sauvegardes/rétentions, paramétrer, organiser les sauvegardes des différents services vers un coffre-fort chiffré, puis superviser l’état des plans de sauvegarde.

Il existe de nombreux cas d’usages avec AWS Backup :

  • Il permet pour une infrastructure On-Premise de sauvegarder votre AWS Storage Gateway (hébergé au préalable sur votre Hyperviseur préféré ou appliance physique AWS).
  • Il permet dans le cas d’une infrastructure sur le Cloud AWS, de centraliser la gestion de vos sauvegardes de vos volumes EBS/EFS, de vos bases de données RDS ou encore DynamoDB.

Vous pouvez créer un plan de sauvegarde à partir d’un existant, en créer un nouveau via l’interface ou directement par le biais d’un template en JSON.

Vous créez un “Vault” de stockage dédié à votre/vos plans de sauvegarde qui réceptionnera les points de sauvegarde de vos ressources, puis vous définissez les ressources assignées grâce à des Tags key/value ou en spécifiant directement l’ID de la ressource par service (Storage Gateway, EBS/EFS, Bases de données RDS ou DynamoDB).

Vous définissez les ressources assignées directement par le biais de Tags key/value ou en spécifiant directement l’ID de la ressource par service

Sauvegarde et continuité d’activité avec Veeam Backup & Replication et Veeam N2WS

De nombreux partenaires proposent des solutions de stockage et de sauvegarde sur le Cloud AWS permettant de s’intégrer directement avec les services de stockages AWS ou en proposant une couche d’abstraction logicielle supplémentaire.

Veeam, l’un des acteurs historiques de la sauvegarde et de reprise d’activité pour les infrastructures On-Premise virtualisées, a fait l’acquisition début 2018 de la société N2WS lui permettant ainsi d’étendre son catalogue de services lié à la sauvegarde et la restauration sur le Cloud AWS.

Veeam N2WS permet la sauvegarde des VPC et de ses configurations, mais aussi des instances EC2, volumes EBS, Base de données RDS, DynamoDB, Redshift et clusters Aurora. Les éléments sauvegardés et disponibles sur le premier compte peuvent être répliqués sur un autre compte ou région afin de réduire considérablement le temps de coupure et de reprise d’activité en cas d’interruption d’un ou plusieurs services dans une région AWS.

Les différentes solutions de Veeam pour AWS sont :

  • Cloud Data Retention : permet une capacité de stockage infini pour la rétention long terme en utilisant nativement l’intégration avec AWS S3 et S3-IA . Solution : Veeam Cloud Tier
  • Cloud Mobility : permet de porter la data et la restauration de n’importe quel environnement vers un environnement AWS. Solution : Veeam Cloud Mobility
  • AWS Data Protection : mitiger les risques et assurer la compliance des données sur AWS. Solution : N2WS Backup & Recovery Veeam Availability for AWS
  • VMware Cloud on AWS : protège sans coupure les environnements hybrides VMware (On-Premise et dans AWS). Solution : Veeam Availability Suite

Avec l’introduction de la version Veeam Backup & Replication 9.5 update 4 les clients peuvent maintenant bénéficier de Veeam Repository vers AWS S3 leur permettant d’externaliser les sauvegardes serveurs de leurs serveurs virtualisés (On-premise et EC2). Je ne rentrerais pas dans un Deep Dive des nouvelles fonctionnalités ajoutées qui sont en lien avec le Cloud AWS (pour cela se référer à la Release note officielle)

Les cas d’usages sont nombreux : De la sauvegarde et restauration pour de la reprise d’activité à la consolidation d’infrastructure ou à une migration de ses machines virtuelles vers AWS.

  • La sauvegarde de l’infrastructure virtualisée On-premise et l’externalisation des sauvegarde vers le Cloud AWS, puis …
    • la restauration vers l’infrastructure On-Premise des machines virtuelles
    • la restauration vers le Cloud AWS (EC2) des machines virtuelles
  • La migration de ses machines virtuelles vers le Cloud AWS

Sources:


Commentaires :

A lire également sur le sujet :