- Introduction
- Snapshot (Instantané)
- Sauvegarde Incrémentielle
- Sauvegarde Différentielle
- Déduplication
- Tableau Comparatif
- Logiciels de Backup
- Bonnes Pratiques
- Concepts Supplémentaires
La sauvegarde est un élément primordial de la sécurité informatique. Aucun système n'est 100% sécurisé, il faut donc se préparer à l'échec des mesures de sécurité. Ce guide explique les différentes techniques de sauvegarde et de stockage pour protéger vos données.
Scenario courant : Une attaque par ransomware sur le serveur de fichiers. Sans sauvegardes, les données sont perdues à jamais. Avec des sauvegardes, tu peux restaurer les données et continuer ton activité.
Un snapshot est une photographie du système de fichiers à un moment précis. C'est très rapide et léger parce que les données ne sont pas vraiment copiées. Au lieu de ça, seules les modifications ultérieures sont stockées.
- ✅ Très rapide à créer et restaurer
- ✅ Stocké sur le même support généralement
- ✅ Permet de revenir à des versions antérieures rapidement
- ✅ On peut en faire fréquemment (toutes les 30-60 minutes)
⚠️ Pas une vraie sauvegarde (les données ne sont pas copiées)
Tu prends une photo de ton dossier à 10h. À 14h, tu as modifié 5 fichiers. Le snapshot ne conserve que ces 5 modifications, pas tout le dossier.
Les snapshots sont stockés sur la même baie de stockage (en général). Et même si ce n'est pas le cas, les snapshots seuls ne permettent pas la restauration complète des données en cas de perte totale du système.
On sauvegarde uniquement les fichiers ajoutés/modifiés depuis la dernière sauvegarde complète OU incrémentielle.
- ✅ Très rapide et très légère
- ✅ Chaque backup incrémental référence le précédent
⚠️ Restauration complexe : tu dois restaurer la complète + TOUS les incrémentaux successifs- 🎯 Idéale pour les sauvegardes quotidiennes
Lundi : Sauvegarde complète (100 GB)
Mardi : Sauvegarde incrémentielle (10 GB - fichiers modifiés lundi-mardi)
Mercredi: Sauvegarde incrémentielle (8 GB - fichiers modifiés mardi-mercredi)
Jeudi : Sauvegarde incrémentielle (12 GB - fichiers modifiés mercredi-jeudi)
Pour restaurer les données telles qu'elles étaient jeudi soir, tu dois :
- Restaurer la sauvegarde complète du lundi (100 GB)
- Appliquer l'incrémentielle du mardi (10 GB)
- Appliquer l'incrémentielle du mercredi (8 GB)
- Appliquer l'incrémentielle du jeudi (12 GB)
Total restauré : 130 GB en 4 étapes
- Économie d'espace disque importante
- Très rapide après la sauvegarde complète
- Chaîne de dépendances fragile (perte d'un maillon = impossible de restaurer après)
- Restauration complexe et longue
On sauvegarde uniquement les fichiers ajoutés/modifiés depuis la dernière sauvegarde complète (peu importe combien de différentiels il y a eu entre).
- ✅ Un peu plus lente et volumineuse que l'incrémentielle
- ✅ Restauration plus simple : complète + dernier différentiel
- ✅ Moins de risque de chaîne cassée
- 🎯 Meilleur compromis entre vitesse et complexité
Lundi : Sauvegarde complète (100 GB)
Mardi : Sauvegarde différentielle (18 GB - fichiers modifiés depuis lundi)
Mercredi: Sauvegarde différentielle (26 GB - fichiers modifiés depuis lundi)
Jeudi : Sauvegarde différentielle (38 GB - fichiers modifiés depuis lundi)
Pour restaurer les données telles qu'elles étaient jeudi soir, tu dois :
- Restaurer la sauvegarde complète du lundi (100 GB)
- Appliquer le différentiel du jeudi (38 GB)
Total restauré : 138 GB en 2 étapes seulement
- Restauration plus simple que l'incrémentielle
- Moins de dépendances (pas besoin de toute la chaîne)
- Redondance naturelle
- Plus volumineuse que l'incrémentielle (redondance des données modifiées)
- Un peu plus lente à créer
La déduplication est une technique qui élimine les copies redondantes de données pour économiser l'espace de stockage. Elle fonctionne en découpant les fichiers en petits morceaux (chunks) et en ne conservant qu'une seule copie de chaque chunk identique.
VM1 : Document.pdf (100 MB)
VM2 : Document.pdf (100 MB) - fichier identique
Sans déduplication : 200 MB stockés
Avec déduplication : 100 MB stockés (le système reconnaît qu'ils sont identiques)
Les systèmes modernes utilisent deux approches :
- Divise les fichiers en morceaux de même taille (ex: 64 KB)
- ✅ Plus simple à implémenter
- ❌ Moins efficace si les fichiers sont légèrement modifiés
- Divise intelligemment selon le contenu (ex: 64 KiB à 4 MiB)
- ✅ Meilleure déduplication
- ✅ Très efficace si des fichiers sont légèrement modifiés
- Utilisé par Proxmox Backup Server
- 💾 Économie d'espace énorme (réduction de 50-90% selon les données)
- ⚡ Moins de transfert réseau (surtout avec les sauvegardes cloud)
- 💰 Moins besoin de stockage = moins de coûts matériels
- 🚀 Excellent pour les environnements virtualisés (beaucoup de VMs avec données communes)
⚠️ Consomme du CPU et de la RAM pour calculer les hash- ⏱️ Ralentit légèrement les sauvegardes/restaurations
- 🔒 Incompatible avec le chiffrement utilisant des clés différentes
- 🧠 Nécessite une infrastructure plus complexe
- Environnements Proxmox avec plusieurs VMs
- Sauvegardes cloud (où l'espace = argent)
- Données avec beaucoup de redondance (templates, bases communes)
| Aspect | Snapshot | Incrémentielle | Différentielle | Déduplication |
|---|---|---|---|---|
| Vitesse création | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| Taille fichier | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Facilité restauration | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| Vraie sauvegarde ? | ❌ Non | ✅ Oui | ✅ Oui | ✅ Oui |
| Complexité setup | Basse | Moyenne | Basse-Moyenne | Haute |
| Économie d'espace | Moyenne | Moyenne | Moyenne | ⭐⭐⭐⭐⭐ |
| Fréquence typique | Chaque 30-60 min | Quotidienne | Quotidienne | Variable |
Déduplication : ✅ Oui, mais limitée
- Déduplication au niveau du job uniquement : les VMs doivent être dans le même job pour profiter de la déduplication
⚠️ Pas de déduplication entre jobs différents ou entre sauvegardes complètes successives- Meilleure efficacité si VMs créées depuis le même template et regroupées dans un seul job
- Excellent pour les environnements virtualisés (Hyper-V, vSphere)
- Interface graphique intuitive
- Support commercial professionnel
Cas d'usage : Entreprises avec budget important, environnements Hyper-V/vSphere, déduplication non critique
Déduplication : ✅ Excellente et globale
- Utilise un algorithme SHA-256 pour détecter les blocs identiques et les réutiliser entre tous les snapshots
- Chunking variable pour fichiers (Buzhash) et fixe 4 MiB pour blocs VM
- Déduplication au niveau du repository : s'applique à TOUS les snapshots, même d'origines différentes
- Combine déduplication + compression ZSTD
- ✅ Automatique (aucune configuration nécessaire)
- C'est l'avantage majeur de PBS vs Veeam
Cas d'usage : Environnements Proxmox VE, open-source, besoin de déduplication maximale
Important : Si chiffrement avec clé différente = déduplication impossible pour ces données
Déduplication :
- Utilise les hardlinks/symlinks au lieu du vrai chunking
- Moins efficace que Veeam et Proxmox Backup Server
- Solution gratuite et open-source
- Interface web simple
Cas d'usage : Petites entreprises, budgets serrés, déduplication non critique
| Logiciel | Déduplication | Type | Coût | Complexité |
|---|---|---|---|---|
| Veeam | ✅ Par job | Commercial | 💰💰💰 | Moyenne |
| Proxmox Backup | ✅ Globale | Open-source | 💰 | Moyenne-Haute |
| UrBackup | Open-source | 💰 | Basse |
Combinez tous ces concepts pour une protection optimale :
Sauvegarde complète : 1x par semaine
Sauvegarde différentielle: Tous les jours
Snapshots : Toutes les heures
Déduplication : Activée sur le serveur de backup
- 📸 Snapshots = Restaurations rapides et fréquentes (fichiers supprimés accidentellement)
- 💾 Sauvegardes = Vraie redondance et protection long-terme (incidents critiques)
- 🗜️ Déduplication = Économie massive d'espace disque
Pour sauvegarder dans les règles de l'art :
- ✅ Au moins 3 copies d'un fichier (la production + 2 sauvegardes)
- ✅ Stockées sur au moins 2 supports différents (disque dur interne + bande magnétique, par exemple)
- ✅ 1 support hors-site/hors-ligne (coffre-fort externe, cloud, ou bande stockée ailleurs)
Production : Serveur principal (1ère copie)
Sauvegarde 1 : Serveur différent (2ème copie) - en-site
Sauvegarde 2 : Bande magnétique en coffre-fort (3ème copie) - hors-site
PDMA (Perte de Données Maximale Admissible) = RPO (Recovery Point Objective)
- Durée en heures/minutes que l'on est prêt à perdre en cas d'incident
- PDMA de 24h = sauvegarde quotidienne suffisante
- PDMA de 6h = 4 sauvegardes par jour nécessaires
DMIA (Durée Maximale d'Interruption Admissible) = RTO (Recovery Time Objective)
- Temps d'interruption toléré avant que le service soit à nouveau opérationnel
- Ces métriques sont définies dans le SLA (Service Level Agreement)
Très important : Avoir des sauvegardes, c'est bien. Tester leur restauration, c'est mieux !
Des sauvegardes impossibles à restaurer après un incident les rendent caduques (inutiles).
Plan de test recommandé :
- Test de restauration complète : 1x par trimestre
- Test de restauration partielle : 1x par mois
- Documentation du processus de restauration
La sauvegarde la plus simple : on fait une copie conforme du dossier entier sur un support différent.
Avantages :
- ✅ Restauration facile (une seule sauvegarde)
- ✅ Aucune dépendance
Inconvénients :
- ❌ Très lente et volumineuse
- ❌ Gourmande en ressources réseau/disque
Pour les entreprises ne tolérant aucune interruption de service, on met en place de la réplication :
Réplication Synchrone ("miroir")
- Toutes les entrées/sorties sont faites sur 2 serveurs/disques simultanément
- Zéro perte de données
- Plus lent mais garantie de cohérence
Réplication Asynchrone
- Copie des modifications après la fin de l'écriture sur le premier support
- Ou toutes les 1/5/10 minutes
- Plus rapide mais risque minimal de perte
PRA = Plan de Reprise d'Activité (Disaster Recovery Plan en anglais) PCA = Plan de Continuité d'Activité
Ces plans indiquent comment remettre un service en état de fonctionnement après un incident. Les sauvegardes (et leur restauration !) sont primordiales dans un PRA ou PCA.
Bande magnétique (LTO)
- Très bon marché à long terme
- Très capacité
- Accès lent (à conserver hors-site)
Disque Dur (mécanique)
- Bon équilibre vitesse/prix
- Accès rapide
- DAS, NAS, SAN
Supports Optiques (CD, DVD, Blu-ray)
- Peu recommandés pour les sauvegardes modernes
- M-Disc : très longévité (100+ ans)
Mémoire Flash (SSD)
- Ultra rapide
- Cher
- Clés USB, cartes SD
Avantages :
- ✅ Hors-site automatiquement (règle 3-2-1 respectée)
- ✅ Pas de matériel à gérer
- ✅ Déduplication très efficace
- ✅ Bande passante répartie
Inconvénients :
- ❌ Coûts récurrents
- ❌ Dépendance du fournisseur
- ❌ Latence réseau
Pour une stratégie de sauvegarde robuste :
- Comprenez vos besoins (PDMA, DMIA, SLA)
- Utilisez la règle 3-2-1 (3 copies, 2 supports, 1 hors-site)
- Combinez les techniques (snapshots + sauvegardes + déduplication)
- Testez régulièrement (restauration = validation)
- Documentez tout (processus, horaires, contacts)
- Automatisez (ne pas faire manuellement)
- Choisissez le bon outil (Veeam, PBS, UrBackup selon votre contexte)