Skip to content

Instantly share code, notes, and snippets.

@stephdl
Created January 12, 2026 07:25
Show Gist options
  • Select an option

  • Save stephdl/3316b9017681ea411c77389262d83a5f to your computer and use it in GitHub Desktop.

Select an option

Save stephdl/3316b9017681ea411c77389262d83a5f to your computer and use it in GitHub Desktop.
Sauvegarde & Stockage : Guide Complet

Sauvegarde & Stockage : Guide Complet

Table des Matières

  1. Introduction
  2. Snapshot (Instantané)
  3. Sauvegarde Incrémentielle
  4. Sauvegarde Différentielle
  5. Déduplication
  6. Tableau Comparatif
  7. Logiciels de Backup
  8. Bonnes Pratiques
  9. Concepts Supplémentaires

Introduction

La sauvegarde est un élément primordial de la sécurité informatique. Aucun système n'est 100% sécurisé, il faut donc se préparer à l'échec des mesures de sécurité. Ce guide explique les différentes techniques de sauvegarde et de stockage pour protéger vos données.

Scenario courant : Une attaque par ransomware sur le serveur de fichiers. Sans sauvegardes, les données sont perdues à jamais. Avec des sauvegardes, tu peux restaurer les données et continuer ton activité.


Snapshot (Instantané)

Définition

Un snapshot est une photographie du système de fichiers à un moment précis. C'est très rapide et léger parce que les données ne sont pas vraiment copiées. Au lieu de ça, seules les modifications ultérieures sont stockées.

Caractéristiques

  • ✅ Très rapide à créer et restaurer
  • ✅ Stocké sur le même support généralement
  • ✅ Permet de revenir à des versions antérieures rapidement
  • ✅ On peut en faire fréquemment (toutes les 30-60 minutes)
  • ⚠️ Pas une vraie sauvegarde (les données ne sont pas copiées)

Exemple Pratique

Tu prends une photo de ton dossier à 10h. À 14h, tu as modifié 5 fichiers. Le snapshot ne conserve que ces 5 modifications, pas tout le dossier.

Limitations

Les snapshots sont stockés sur la même baie de stockage (en général). Et même si ce n'est pas le cas, les snapshots seuls ne permettent pas la restauration complète des données en cas de perte totale du système.


Sauvegarde Incrémentielle

Définition

On sauvegarde uniquement les fichiers ajoutés/modifiés depuis la dernière sauvegarde complète OU incrémentielle.

Caractéristiques

  • ✅ Très rapide et très légère
  • ✅ Chaque backup incrémental référence le précédent
  • ⚠️ Restauration complexe : tu dois restaurer la complète + TOUS les incrémentaux successifs
  • 🎯 Idéale pour les sauvegardes quotidiennes

Exemple de Chaîne de Sauvegarde

Lundi   : Sauvegarde complète (100 GB)
Mardi   : Sauvegarde incrémentielle (10 GB - fichiers modifiés lundi-mardi)
Mercredi: Sauvegarde incrémentielle (8 GB - fichiers modifiés mardi-mercredi)
Jeudi   : Sauvegarde incrémentielle (12 GB - fichiers modifiés mercredi-jeudi)

Restauration le Jeudi

Pour restaurer les données telles qu'elles étaient jeudi soir, tu dois :

  1. Restaurer la sauvegarde complète du lundi (100 GB)
  2. Appliquer l'incrémentielle du mardi (10 GB)
  3. Appliquer l'incrémentielle du mercredi (8 GB)
  4. Appliquer l'incrémentielle du jeudi (12 GB)

Total restauré : 130 GB en 4 étapes

Avantages

  • Économie d'espace disque importante
  • Très rapide après la sauvegarde complète

Inconvénients

  • Chaîne de dépendances fragile (perte d'un maillon = impossible de restaurer après)
  • Restauration complexe et longue

Sauvegarde Différentielle

Définition

On sauvegarde uniquement les fichiers ajoutés/modifiés depuis la dernière sauvegarde complète (peu importe combien de différentiels il y a eu entre).

Caractéristiques

  • ✅ Un peu plus lente et volumineuse que l'incrémentielle
  • Restauration plus simple : complète + dernier différentiel
  • ✅ Moins de risque de chaîne cassée
  • 🎯 Meilleur compromis entre vitesse et complexité

Exemple de Chaîne de Sauvegarde

Lundi   : Sauvegarde complète (100 GB)
Mardi   : Sauvegarde différentielle (18 GB - fichiers modifiés depuis lundi)
Mercredi: Sauvegarde différentielle (26 GB - fichiers modifiés depuis lundi)
Jeudi   : Sauvegarde différentielle (38 GB - fichiers modifiés depuis lundi)

Restauration le Jeudi

Pour restaurer les données telles qu'elles étaient jeudi soir, tu dois :

  1. Restaurer la sauvegarde complète du lundi (100 GB)
  2. Appliquer le différentiel du jeudi (38 GB)

Total restauré : 138 GB en 2 étapes seulement

Avantages

  • Restauration plus simple que l'incrémentielle
  • Moins de dépendances (pas besoin de toute la chaîne)
  • Redondance naturelle

Inconvénients

  • Plus volumineuse que l'incrémentielle (redondance des données modifiées)
  • Un peu plus lente à créer

Déduplication

Définition

La déduplication est une technique qui élimine les copies redondantes de données pour économiser l'espace de stockage. Elle fonctionne en découpant les fichiers en petits morceaux (chunks) et en ne conservant qu'une seule copie de chaque chunk identique.

Comment ça Fonctionne ?

Exemple Simple

VM1 : Document.pdf (100 MB)
VM2 : Document.pdf (100 MB) - fichier identique

Sans déduplication : 200 MB stockés
Avec déduplication : 100 MB stockés (le système reconnaît qu'ils sont identiques)

Chunking (Découpe en Morceaux)

Les systèmes modernes utilisent deux approches :

Chunks de Taille Fixe

  • Divise les fichiers en morceaux de même taille (ex: 64 KB)
  • ✅ Plus simple à implémenter
  • ❌ Moins efficace si les fichiers sont légèrement modifiés

Chunks de Taille Variable

  • Divise intelligemment selon le contenu (ex: 64 KiB à 4 MiB)
  • ✅ Meilleure déduplication
  • ✅ Très efficace si des fichiers sont légèrement modifiés
  • Utilisé par Proxmox Backup Server

Avantages

  • 💾 Économie d'espace énorme (réduction de 50-90% selon les données)
  • Moins de transfert réseau (surtout avec les sauvegardes cloud)
  • 💰 Moins besoin de stockage = moins de coûts matériels
  • 🚀 Excellent pour les environnements virtualisés (beaucoup de VMs avec données communes)

Inconvénients

  • ⚠️ Consomme du CPU et de la RAM pour calculer les hash
  • ⏱️ Ralentit légèrement les sauvegardes/restaurations
  • 🔒 Incompatible avec le chiffrement utilisant des clés différentes
  • 🧠 Nécessite une infrastructure plus complexe

Cas d'Usage Parfait

  • Environnements Proxmox avec plusieurs VMs
  • Sauvegardes cloud (où l'espace = argent)
  • Données avec beaucoup de redondance (templates, bases communes)

Tableau Comparatif

Aspect Snapshot Incrémentielle Différentielle Déduplication
Vitesse création ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐
Taille fichier ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐
Facilité restauration ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐
Vraie sauvegarde ? ❌ Non ✅ Oui ✅ Oui ✅ Oui
Complexité setup Basse Moyenne Basse-Moyenne Haute
Économie d'espace Moyenne Moyenne Moyenne ⭐⭐⭐⭐⭐
Fréquence typique Chaque 30-60 min Quotidienne Quotidienne Variable

Logiciels de Backup

Veeam Backup & Replication

Déduplication : ✅ Oui, mais limitée

  • Déduplication au niveau du job uniquement : les VMs doivent être dans le même job pour profiter de la déduplication
  • ⚠️ Pas de déduplication entre jobs différents ou entre sauvegardes complètes successives
  • Meilleure efficacité si VMs créées depuis le même template et regroupées dans un seul job
  • Excellent pour les environnements virtualisés (Hyper-V, vSphere)
  • Interface graphique intuitive
  • Support commercial professionnel

Cas d'usage : Entreprises avec budget important, environnements Hyper-V/vSphere, déduplication non critique


Proxmox Backup Server (PBS)

Déduplication : ✅ Excellente et globale

  • Utilise un algorithme SHA-256 pour détecter les blocs identiques et les réutiliser entre tous les snapshots
  • Chunking variable pour fichiers (Buzhash) et fixe 4 MiB pour blocs VM
  • Déduplication au niveau du repository : s'applique à TOUS les snapshots, même d'origines différentes
  • Combine déduplication + compression ZSTD
  • ✅ Automatique (aucune configuration nécessaire)
  • C'est l'avantage majeur de PBS vs Veeam

Cas d'usage : Environnements Proxmox VE, open-source, besoin de déduplication maximale

Important : Si chiffrement avec clé différente = déduplication impossible pour ces données


UrBackup

Déduplication : ⚠️ Limitée

  • Utilise les hardlinks/symlinks au lieu du vrai chunking
  • Moins efficace que Veeam et Proxmox Backup Server
  • Solution gratuite et open-source
  • Interface web simple

Cas d'usage : Petites entreprises, budgets serrés, déduplication non critique


Tableau Récapitulatif

Logiciel Déduplication Type Coût Complexité
Veeam ✅ Par job Commercial 💰💰💰 Moyenne
Proxmox Backup ✅ Globale Open-source 💰 Moyenne-Haute
UrBackup ⚠️ Limitée Open-source 💰 Basse

Bonnes Pratiques

Recommandation Générale

Combinez tous ces concepts pour une protection optimale :

Sauvegarde complète      : 1x par semaine
Sauvegarde différentielle: Tous les jours
Snapshots                : Toutes les heures
Déduplication            : Activée sur le serveur de backup

Avantages de cette Stratégie

  • 📸 Snapshots = Restaurations rapides et fréquentes (fichiers supprimés accidentellement)
  • 💾 Sauvegardes = Vraie redondance et protection long-terme (incidents critiques)
  • 🗜️ Déduplication = Économie massive d'espace disque

Règle "3-2-1"

Pour sauvegarder dans les règles de l'art :

  • Au moins 3 copies d'un fichier (la production + 2 sauvegardes)
  • Stockées sur au moins 2 supports différents (disque dur interne + bande magnétique, par exemple)
  • 1 support hors-site/hors-ligne (coffre-fort externe, cloud, ou bande stockée ailleurs)

Exemple Concret

Production    : Serveur principal (1ère copie)
Sauvegarde 1  : Serveur différent (2ème copie) - en-site
Sauvegarde 2  : Bande magnétique en coffre-fort (3ème copie) - hors-site

PDMA et DMIA

PDMA (Perte de Données Maximale Admissible) = RPO (Recovery Point Objective)

  • Durée en heures/minutes que l'on est prêt à perdre en cas d'incident
  • PDMA de 24h = sauvegarde quotidienne suffisante
  • PDMA de 6h = 4 sauvegardes par jour nécessaires

DMIA (Durée Maximale d'Interruption Admissible) = RTO (Recovery Time Objective)

  • Temps d'interruption toléré avant que le service soit à nouveau opérationnel
  • Ces métriques sont définies dans le SLA (Service Level Agreement)

Testez vos Sauvegardes !

Très important : Avoir des sauvegardes, c'est bien. Tester leur restauration, c'est mieux !

Des sauvegardes impossibles à restaurer après un incident les rendent caduques (inutiles).

Plan de test recommandé :

  • Test de restauration complète : 1x par trimestre
  • Test de restauration partielle : 1x par mois
  • Documentation du processus de restauration

Concepts Supplémentaires

Sauvegarde Complète

La sauvegarde la plus simple : on fait une copie conforme du dossier entier sur un support différent.

Avantages :

  • ✅ Restauration facile (une seule sauvegarde)
  • ✅ Aucune dépendance

Inconvénients :

  • ❌ Très lente et volumineuse
  • ❌ Gourmande en ressources réseau/disque

Réplication des Données

Pour les entreprises ne tolérant aucune interruption de service, on met en place de la réplication :

Réplication Synchrone ("miroir")

  • Toutes les entrées/sorties sont faites sur 2 serveurs/disques simultanément
  • Zéro perte de données
  • Plus lent mais garantie de cohérence

Réplication Asynchrone

  • Copie des modifications après la fin de l'écriture sur le premier support
  • Ou toutes les 1/5/10 minutes
  • Plus rapide mais risque minimal de perte

PRA / PCA

PRA = Plan de Reprise d'Activité (Disaster Recovery Plan en anglais) PCA = Plan de Continuité d'Activité

Ces plans indiquent comment remettre un service en état de fonctionnement après un incident. Les sauvegardes (et leur restauration !) sont primordiales dans un PRA ou PCA.

Supports de Stockage

Bande magnétique (LTO)

  • Très bon marché à long terme
  • Très capacité
  • Accès lent (à conserver hors-site)

Disque Dur (mécanique)

  • Bon équilibre vitesse/prix
  • Accès rapide
  • DAS, NAS, SAN

Supports Optiques (CD, DVD, Blu-ray)

  • Peu recommandés pour les sauvegardes modernes
  • M-Disc : très longévité (100+ ans)

Mémoire Flash (SSD)

  • Ultra rapide
  • Cher
  • Clés USB, cartes SD

Stockage Cloud

Avantages :

  • ✅ Hors-site automatiquement (règle 3-2-1 respectée)
  • ✅ Pas de matériel à gérer
  • ✅ Déduplication très efficace
  • ✅ Bande passante répartie

Inconvénients :

  • ❌ Coûts récurrents
  • ❌ Dépendance du fournisseur
  • ❌ Latence réseau

Résumé Final

Pour une stratégie de sauvegarde robuste :

  1. Comprenez vos besoins (PDMA, DMIA, SLA)
  2. Utilisez la règle 3-2-1 (3 copies, 2 supports, 1 hors-site)
  3. Combinez les techniques (snapshots + sauvegardes + déduplication)
  4. Testez régulièrement (restauration = validation)
  5. Documentez tout (processus, horaires, contacts)
  6. Automatisez (ne pas faire manuellement)
  7. Choisissez le bon outil (Veeam, PBS, UrBackup selon votre contexte)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment