Les snapshots sont des outils précieux que tous les administrateurs apprécient lors de mises à jour délicates, de modifications de configurations ou lors de tests risqués. Ils permettent de sauvegarder un instantané de l’état d’une machine virtuelle et de revenir en arrière si une intervention échoue. Utilisés judicieusement, ils sont rapides, pratiques et extrêmement utiles. Mal gérés, ils peuvent devenir une source de problèmes de performances, de consommation de stockage et de risques opérationnels.
Le scénario est plus fréquent qu’on ne le pense : quelqu’un crée un snapshot « au cas où » avant une mise à jour, la procédure se termine, la machine continue de fonctionner et personne n’y pense plus. Des semaines, des mois, voire des années plus tard, l’environnement devient lent, le stockage augmente sans raison apparente et les consolidations deviennent complexes. Le problème ne réside pas dans le snapshot lui-même, mais dans l’oubli de sa présence.
L’exemple fourni par l’équipe de Stackscale (Aire) Infrastructure IT illustre bien cela : un client a rencontré des problèmes de performance sur plusieurs machines virtuelles, et lors de l’analyse, des snapshots accumulés depuis près de trois ans ont été découverts. Ce n’est pas un cas extrême hors norme, mais une négligence fréquente dans des environnements dépourvus de politique claire de revue, d’expiration et de suppression des snapshots.
Une outil temporaire, non une sauvegarde
La confusion la plus dangereuse consiste à croire qu’un snapshot équivaut à une sauvegarde. Ce n’est pas le cas. Un snapshot dépend du disque d’origine et de l’état de la machine virtuelle au moment de sa création. Il sert à revenir à un point précis après un changement récent, mais ne garantit pas une protection comparable à une copie de sauvegarde stockée séparément, vérifiable et récupérable.
Broadcom, dans ses bonnes pratiques pour VMware, le précise clairement : il ne faut pas utiliser les snapshots comme des sauvegardes. Il recommande également de ne pas conserver un snapshot plus de 72 heures et de limiter leur nombre dans une chaîne. Bien que techniquement vSphere supporte jusqu’à 32 snapshots, la raison en est simple : plus ils restent actifs longtemps, plus les fichiers delta grossissent, impactant performances et stockage.
Dans Proxmox VE, les snapshots servent aussi à préserver l’état d’une machine virtuelle pour y revenir ultérieurement, mais les sauvegardes sont gérées séparément. La documentation de Proxmox explique que les backups incluent la configuration de la VM ou du conteneur et tous ses données, et peuvent être lancés via l’interface graphique ou en ligne de commande avec vzdump. La logique différencie clairement snapshot opérationnel et sauvegarde complète.
| Concept | Snapshot | Sauvegarde |
|---|---|---|
| Objectif | Revenir à un changement précis | Recouvrer données ou systèmes en cas de perte ou catastrophe |
| Durée recommandée | Temporaire, généralement heures ou quelques jours | Selon politique prédéfinie |
| Dépendance du disque d’origine | Elevée | Doit pouvoir être restaurée indépendamment |
| Usage habituel | Mises à jour, maintenance, tests contrôlés | Continuité, récupération, conformité, protection contre ransomwares |
| Risque si oublié | Croissance, ralentissement, consolidations complexes | |
| Lieu de stockage | Dans le même environnement VM | |
| Idéalement | Dans un environnement séparé, protégé voire immuable |
Que se passe-t-il lorsqu’un snapshot reste trop longtemps
Lorsqu’un snapshot est créé, la machine virtuelle ne modifie plus directement le disque de base, mais enregistre ses changements dans des fichiers ou volumes liés au snapshot. Le système conserve ainsi la possibilité de revenir à l’état initial, mais introduit une couche supplémentaire de gestion. Cette couche n’est pas problématique pour une courte période, mais devient risquée si elle s’accumule.
Avec le temps, la taille des delta augmente. Si la machine a beaucoup d’activité disque, ces fichiers peuvent occuper beaucoup d’espace. Plusieurs snapshots chaînés amplifient l’impact, chaque lecture ou écriture pouvant nécessiter plus de travail. En cas de bases de données, serveurs de fichiers, ERP ou VM à forte capacité d’I/O, la dégradation peut être significative.
VMware a publié des analyses détaillées sur l’impact des snapshots sur la performance des applications et leur gestion lors de l’approvisionnement. La règle pratique pour les administrateurs : gérer soigneusement les snapshots, surtout dans des environnements à forte charge ou où la consolidation peut affecter une fenêtre de maintenance ou le stockage.
| Risque | Manifestation |
|---|---|
| Dégradation des performances | VM fonctionne avec des couches de disque additionnelles |
| Croissance du stockage | Les changements s’accumulent dans des fichiers delta ou volumes liés |
| Consolidations lentes | Fusionner les changements exige plus de temps lors de la suppression |
| Fenêtres de maintenance prolongées | Consolidation lente si le snapshot est étendu |
| Risque opérationnel | Faille du stockage lors d’une consolidation critique |
| Fausse sensation de sécurité | Croire que c’est une sauvegarde alors qu’il ne s’agit que d’un point temporel dépendant du disque de base |
Ce problème s’aggrave quand des snapshots manuels cohabitent avec ceux créés par des outils de sauvegarde. Certains outils utilisent des snapshots temporaires pour capturer une VM en cours d’exécution, avant de les supprimer, mais en cas d’échec, des snapshots orphelins peuvent rester sans visibilité claire dans la console principale. C’est pourquoi des revues régulières sont indispensables.
Bonnes pratiques pour VMware, Proxmox et environnements hybrides
VMware et Proxmox gèrent les snapshots différemment, mais la discipline opératoire est similaire : créer uniquement quand nécessaire, documenter la raison, fixer une date d’expiration et supprimer à la fin de l’intervention. Enproduction, un snapshot sans propriétaire ni date devient une dette technique.
La règle essentielle : tout snapshot doit avoir un motif et un responsable. Avant une mise à jour d’un ERP, un changement d’application ou une modification réseau, il faut indiquer qui l’a créé et quand il sera revu. Dans une équipe multi-utilisateurs, cette traçabilité évite qu’une mesure temporaire devienne un problème chronique.
La seconde règle : n’utiliser les snapshots ni comme substituts de sauvegarde. Pour une récupération fiable, il faut prévoir des copies programmées, stockées dans des dépôts sécurisés, vérifiées, avec une politique de rétention, et protégées contre la suppression accidentelle ou attaques de ransomwares. En Proxmox, Proxmox Backup Server facilite la gestion de dépôts déduplication et structurés pour les sauvegardes. Chez VMware, les outils de sauvegarde s’intègrent via API, mais le principe reste : la sauvegarde doit survivre à une défaillance de l’environnement primaire.
La troisième règle consiste à faire des revues régulières. Un rapport hebdomadaire ou mensuel sur les snapshots actifs peut éviter beaucoup d’incidents. Sur les grands environnements, cela peut être automatisé avec des alertes pour l’ancienneté, la taille ou le nombre de snapshots par VM. Attendre que le stockage se remplisse est souvent tardif ; mieux vaut anticiper.
| Bonne pratique | Application concrète |
|---|---|
| Définir une durée maximale | Exemple : 24-72 heures sauf exception documentée |
| Nommer correctement | Inclure motif, date et responsable |
| Vérifier périodiquement | Générer des rapports automatiques sur l’ancienneté et la taille |
| Ne pas chaîner sans contrôle | Éviter plusieurs couches sauf nécessité justifiée |
| Valider les sauvegardes | Tester leur restauration, pas seulement leur finalisation |
| Consolider lors de fenêtres planifiées | Programmer la suppression de gros snapshots pour éviter l’impact |
| Former l’équipe | Rappeler que snapshot n’est pas synonyme de sauvegarde |
Le vrai problème n’est pas de créer des snapshots, mais de ne pas en assurer la gouvernance
Les snapshots sont mal réputés dans certains départements parce qu’ils ont été mal utilisés. Mais les interdire complètement n’a pas de sens. Ils restent des outils très utiles pour des tâches contrôlées : mises à jour du système, modifications d’application, tests de configuration, interventions de maintenance ou validations avant déploiement.
L’équilibre consiste à les traiter comme ce qu’ils sont : une méthode temporaire de reversal. Ainsi comme personne ne laisserait un échafaudage en place indéfiniment après la fin des travaux, un snapshot ne devrait pas rester actif plusieurs mois après la fin d’une intervention.
Sur des plateformes comme VMware ou Proxmox, leur bon usage est efficace si leurs limites sont respectées. Le vrai problème survient lorsqu’ils deviennent une pratique informelle, sans inventaire, sans politique ni contrôle. Dans ce cas, ils cessent d’être un filet de sécurité et deviennent une surcharge invisible pour l’environnement.
La virtualisation a permis aux services IT de gagner en flexibilité, mais elle facilite aussi l’accumulation de petites décisions oubliées : disques temporaires, anciennes images, VMs éteintes, snapshots sans usage et configurations en suspens. Chacune peut sembler anodine, mais cumulées, elles expliquent souvent des dégradations de performance et des limitations de capacité.
La recommandation finale est simple : faire régulière une revue des snapshots doit faire partie de l’hygiène de base de tout environnement virtualisé. Tout comme on vérifie les backups, les patches, les alertes matériel ou la capacité de stockage, il est aussi essentiel de connaître et de supprimer les snapshots obsolètes ou inutiles.
Un snapshot peut sauver une opération. Un snapshot oublié peut compliquer tout un environnement.
Questions/Réponses
Un snapshot sert-il de sauvegarde ?
Non. Un snapshot est un instantané temporaire dépendant de l’environnement d’origine. Une sauvegarde doit être conçue pour la récupération, avec une rétention appropriée, vérifiée et stockée de façon sécurisée.
Combien de temps un snapshot doit-il être conservé ?
Chez VMware, Broadcom recommande de ne pas conserver les snapshots plus de 72 heures. En général, ils doivent rester temporaires, avec une date d’expiration claire.
Quels problèmes un ancien snapshot peut-il causer ?
Il peut dégrader la performance, consommer beaucoup d’espace, compliquer la consolidation et donner une fausse impression de sécurité.
Est-il mauvais d’utiliser des snapshots avec VMware ou Proxmox ?
Non. Ils sont utiles pour la maintenance, les mises à jour et les modifications contrôlées. Le problème survient lorsqu’ils restent actifs trop longtemps ou sont utilisés comme substituts à une sauvegarde complète.