La résilience du stockage

Ceph découpe les données en blocs et les réplique ×3 sur l'ensemble du cluster. Même si vous perdez un disque entier, vos données restent intactes.

Stockage distribué — Ceph
Les données sont découpées en blocs, répliquées ×3 et réparties sur l'ensemble du cluster.
Données VM "Phenix"
Autres données
Disque en panne
Nœud 1
SSD 1
SSD 2
SSD 3
SSD 4
Nœud 2
SSD 1
SSD 2
SSD 3
SSD 4
Nœud 3
SSD 1
SSD 2
SSD 3
SSD 4
1/4

Stockage classique

Dans un serveur classique, les données d'une VM résident sur un seul disque. Si ce disque tombe en panne, les données sont perdues.

Comment fonctionne Ceph ?

Ceph est un système de stockage « objet » distribué. Contrairement à un disque dur classique où les fichiers sont stockés sur un seul volume, Ceph fonctionne différemment :

  1. Découpage — chaque fichier est découpé en blocs de quelques mégaoctets
  2. Réplication — chaque bloc est copié 3 fois sur des disques différents, idéalement sur des nœuds différents
  3. Distribution — les blocs sont répartis uniformément sur l'ensemble du cluster pour équilibrer la charge
  4. Surveillance — Ceph surveille en permanence l'état de chaque disque (heartbeat toutes les secondes)
  5. Auto-réparation — si un disque disparaît, Ceph recrée les répliques manquantes automatiquement

Stockage classique (NAS/SAN)

Un seul point de défaillance :

  • Les données sont sur un volume unique
  • Si le disque tombe en panne → perte de données
  • La restauration depuis backup prend des heures
  • Le serveur est indisponible pendant toute l'opération

Ceph (stockage distribué)

Aucun point de défaillance unique :

  • Chaque bloc est répliqué ×3 sur le cluster
  • Perte d'un disque → 0 donnée perdue
  • Les VMs continuent de fonctionner normalement
  • Ceph reconstruit automatiquement les blocs manquants

Et les VMs dans tout ça ?

Les VMs tournent sur Proxmox, mais leurs disques virtuels sont stockés sur Ceph. Quand Proxmox redémarre une VM sur un autre nœud (HA), Ceph garantit que les données du disque sont toujours accessibles depuis n'importe quel nœud du cluster.

Voir le schéma de bascule HA Proxmox →