Le plan de reprise après sinistre est souvent contenu dans un document interne, approuvé lors d’une réunion et rapidement révisé en cas d’audit. Le problème surgit lorsque celui-ci cesse d’être une simple hypothèse. Un ransomware chiffre des systèmes critiques, une panne électrique met hors service un centre de données, une baie de stockage commence à se comporter de manière erratique ou une succession d’erreurs transforme une incident technique en une arrêt d’activité. À ce moment-là, la question n’est plus de savoir si des sauvegardes existent, mais combien de temps l’organisation mettra à retrouver ses opérations.
C’est ici qu’intervient le DRaaS, ou Disaster Recovery as a Service. Son principe est simple à comprendre mais difficile à mettre en œuvre correctement : disposer d’un environnement de récupération hors site principal, géré par un fournisseur spécialisé, prêt à relancer des charges critiques si l’infrastructure de production devient indisponible. Avec Veeam, cette approche s’appuie sur des composants bien connus des administrateurs système, tels que Veeam Backup & Replication, Veeam Cloud Connect, Veeam Service Provider Console et, dans des scénarios plus avancés, Veeam Recovery Orchestrator.
Le problème n’est pas de faire des sauvegardes, mais de récupérer dans les délais
Pendant des années, de nombreuses entreprises ont confondu sauvegarde et continuité d’activité. Disposer de copies est indispensable, mais cela ne garantit pas à lui seul que l’entreprise pourra rerouver ses opérations dans le délai nécessaire. Une sauvegarde peut être présente, intacte et restaurable, mais si la relance de dizaines de machines virtuelles, la reconstruction des réseaux, la reconfiguration des accès, la validation des applications et la coordination des dépendances prennent deux jours, l’impact peut devenir insoutenable.
La reprise après sinistre exige de travailler avec deux concepts que le business doit connaître : RPO et RTO. Le RPO définit la perte de données acceptable pour l’organisation. Le RTO indique combien de temps un service peut rester indisponible avant que le dommage devienne critique. Ces métriques ne sont pas de simples notions techniques abstraites ; ce sont des engagements opérationnels. Une boutique en ligne, une plateforme logistique, un ERP, une base de données clinique ou un système de facturation n’ont pas la même tolérance à la perte ou à l’arrêt.
La solution traditionnelle de reprise nécessite souvent un investissement économique conséquent. Construire un second centre de données, acheter du matériel en double, licencier des hyperviseurs, maintenir du stockage, des réseaux, des systèmes de sécurité, de surveillance et du personnel spécialisé représente souvent un coût prohibitif pour beaucoup d’organisations. De plus, une grande partie de cette infrastructure reste sous-utilisée jusqu’à ce qu’un sinistre survienne. C’est pourquoi beaucoup de plans de reprise deviennent partiels, obsolètes ou peu testés.
Le DRaaS cherche à résoudre cet écart. Le fournisseur maintient l’infrastructure de récupération, et le client mime ses charges critiques vers cet environnement. En cas d’incident grave, il est possible de démarrer les machines sur le site secondaire et de continuer à servir jusqu’à ce que le problème soit résolu sur le site principal. Il ne remplace pas un bon design de continuité, mais réduit l’investissement initial et donne accès à des capacités qui étaient autrefois réservées aux grandes organisations.
Comment Veeam s’intègre dans une architecture DRaaS
Dans une configuration classique, le client dispose de Veeam Backup & Replication sur son infrastructure, que ce soit sous VMware vSphere, Microsoft Hyper-V ou d’autres environnements compatibles selon la conception choisie. À partir de là, il configure des tâches de sauvegarde, de réplication ou de protection continue vers le fournisseur. Du côté du fournisseur, Veeam Cloud Connect agit comme une plateforme multi-locataires pour offrir des services de sauvegarde externalisée et de DRaaS à plusieurs clients, séparément.
Cette architecture permet au fournisseur d’allouer des ressources, de gérer les locataires, de contrôler la consommation et d’offrir une capacité de récupération sans que chaque client ait à construire son propre site secondaire. Veeam Service Provider Console ajoute une couche de gestion centralisée pour les fournisseurs de services, avec des fonctionnalités pour administrer les clients, les ressources et les opérations liées à Cloud Connect.
La réplication est une composante essentielle. Veeam Cloud Connect Replication permet de maintenir des copies de machines virtuelles dans l’infrastructure du fournisseur et d’exécuter des processus de failover et failback. En cas de défaillance du site principal, le client ou le fournisseur peuvent initier la coupure vers l’environnement de récupération. Lorsque le site d’origine est de nouveau opérationnel, le failback permet de retourner en production.
Pour des charges critiques sous VMware vSphere, Veeam propose également la Protection Continue des Données (CDP). Conçue pour des machines virtuelles où une perte de données de plusieurs heures est inacceptable, elle vise des objectifs de récupération très courts (secondes ou minutes). Toutes les charges ne nécessitent pas ce niveau de protection, mais pour certains systèmes transactionnels ou services à fort impact, cela peut faire une différence cruciale.
| Composant | Rôle dans le DRaaS |
|---|---|
| Veeam Backup & Replication | Protection, sauvegarde, réplication et récupération des charges |
| Veeam Cloud Connect | Connexion multi-locataires pour sauvegarde externe et DRaaS |
| Veeam Service Provider Console | Gestion centralisée des clients, locataires et ressources pour les MSP |
| Veeam Recovery Orchestrator | Automatisation, documentation et tests des plans de récupération |
| CDP pour VMware vSphere | Protection continue pour des charges avec RPO très serré |
Tester la reprise avant qu’elle ne soit nécessaire
Un plan de reprise qui n’est pas testé est une promesse non tenue. Il peut être bien rédigé, doté de diagrammes précis et avoir passé une revue documentaire, mais jusqu’à ce qu’il soit vérifié dans un environnement contrôlé, on ne peut pas s’assurer qu’il fonctionnera. Les dépendances entre applications, les itinéraires réseau, les DNS, les services d’authentification, les permissions, les temps de démarrage et les tests fonctionnels recèlent souvent des surprises.
Un avantage clé de Veeam dans les scénarios de récupération est la possibilité de réaliser des tests sur des environnements isolés. Veeam Recovery Orchestrator, par exemple, permet d’éprouver des plans complets via DataLabs isolés, où les machines peuvent démarrer et être vérifiées sans impacter la production. Cette démarche permet de transformer la gestion du DR en une discipline opérationnelle continue, plutôt qu’en une réaction improvisée.
Pour un administrateur système, cela modifie la conversation avec la direction. Ce n’est pas simplement dire « nous avons des copies » mais « nous avons testé à six reprises cette année le démarrage des services critiques dans l’environnement de récupération et nous connaissons nos temps réels ». La seconde formulation réduit l’incertitude et permet de prendre des décisions stratégiques mieux informées.
Cela oblige aussi à prioriser. Tout ne doit pas avoir le même RTO ou RPO. Un contrôleur de domaine, une base de données principale, un ERP ou un système de gestion des commandes ont besoin de récupération rapide ; d’autres services peuvent attendre. Un DRaaS bien conçu débute par une analyse d’impact, regroupe les applications par criticité et définit des plans réalistes. Tenter de tout protéger au même niveau de priorité augmente coûte et complexité.
Questions à se poser avant d’adopter un service DRaaS
Le DRaaS ne doit pas être une décision uniquement technique. Avant de s’engager, il est utile d’examiner quels charges seront protégées, quelles dépendances existent, combien de bande passante la réplication nécessite, où sera l’environnement de récupération, comment les utilisateurs accéderont en cas de basculement, et qui déclenchera l’activation. Il faut aussi définir si le fournisseur fournit simplement l’infrastructure ou s’il intervient dans la gestion du plan de reprise.
Un autre point fondamental concerne la sécurité. En cas de ransomware, la récupération ne doit pas dépendre de copies compromises ou de identifiants exposés. La stratégie doit inclure isolement, contrôle d’accès, MFA, segmentation, copies immuables le cas échéant, surveillance et procédures claires visant à éviter une réinfection lors de la restauration.
Le vrai avantage du DRaaS avec Veeam réside dans la transformation du processus de récupération en une démarche connue, documentée et testée. Il s’agit de savoir que faire si demain le centre de données principal disparaît, qui appuie sur le bouton, quelles machines démarrent en priorité, quels services sont vérifiés, comment la communication s’établit avec les utilisateurs et la direction, et comment revenir à l’environnement d’origine.
Pour beaucoup d’organisations, cette sérénité vaut plus que l’économie initiale. Il ne s’agit pas de vivre dans la crainte du scénario catastrophe, mais d’admettre qu’il peut arriver et de disposer d’un plan B qui ne repose pas sur des exploits. En matière de systèmes, la confiance ne s’obtient pas par une présentation PowerPoint, mais par des tests répétés et validés.
Questions fréquemment posées
Qu’est-ce que le DRaaS ?
Le DRaaS est un service de reprise après sinistre où un fournisseur offre une infrastructure et des capacités pour relancer des charges critiques hors du site principal en cas de défaillance majeure.
Le DRaaS remplace-t-il la sauvegarde ?
Non. La sauvegarde reste indispensable. Le DRaaS la complète en proposant un environnement alternatif permettant de restaurer les services dans des délais et avec une perte de données prédéfinis.
Que permet Veeam Cloud Connect dans un contexte DRaaS ?
Veeam Cloud Connect facilite aux fournisseurs la mise à disposition d’une plateforme multi-locataires pour la sauvegarde externe et la reprise après sinistre, connectant l’infrastructure du client à celle du fournisseur.
Pourquoi est-il essentiel de tester le plan de reprise ?
Parce qu’un plan non testé pourrait échouer au moment où l’on en a le plus besoin. Les tests permettent de valider les temps, les dépendances, les réseaux, les applications et les procédures en amont d’une crise réelle.
Sources :
- Veeam Cloud Connect for Service Providers.
- Veeam Cloud Replica Failover and Failback.
- Veeam Continuous Data Protection for VMware vSphere.
- Veeam Service Provider Console, gestion des locataires.
- Veeam Recovery Orchestrator, tests de plans de reprise.