Formation PCA / PRA — Continuité d'Activité
Module 2 : Analyse des risques & BIA
2.3 Choisir sa stratégie de continuité
Le BIA fixe les objectifs (RTO, RPO). La cartographie identifie les menaces. Reste à choisir les bonnes stratégies pour atteindre les objectifs face aux menaces. Sites froid/tiède/chaud/actif, cloud, télétravail : panorama des options et de leurs coûts.
Les 4 types de sites de secours informatique
Site Froid
Local + élec uniquement
RTO : 1-7 jours
Coût : €
Site Tiède
Serveurs + réseau prêts
RTO : 12-48 h
Coût : €€
Site Chaud
Données répliquées
RTO : 1-4 h
Coût : €€€
Actif/Actif
Trafic réparti en continu
RTO : 0-15 min
Coût : €€€€
Site froid : la solution low-cost
Un site froid (cold site) est un local de secours équipé uniquement de l'infrastructure de base : alimentation électrique, climatisation, réseau, mais sans serveurs ni données pré-installés. Tout doit être reconstruit après le sinistre.
Caractéristiques :
- RTO typique : 1 à 7 jours (le temps de livrer, installer, configurer les équipements et restaurer les données).
- RPO : déterminé par la fréquence des sauvegardes externalisées (typiquement 24 h).
- Coût : ~ 5 000 à 20 000 €/mois selon la surface louée.
- Avantage : économique pour les organisations dont les processus tolèrent un arrêt prolongé.
- Inconvénient : très dépendant de la disponibilité d'équipements de remplacement (rupture chaîne d'approvisionnement = retard).
Cas d'usage typiques : administrations communales, cabinets d'experts-comptables, PME sans contrainte temps réel, fonctions support (RH, paie, archivage).
Le site froid est parfois loué chez un prestataire spécialisé (Equinix, Interxion, Stago) qui propose des « salles blanches » mutualisées équipées du minimum.
« Le site froid reste pertinent pour les organisations qui priorisent un coût bas. Mais les délais sont rarement compatibles avec les exigences RGPD/NIS2 de notification rapide. »
— Cabinet Wavestone, étude continuité 2024
Site tiède : le compromis raisonnable
Un site tiède (warm site) dispose des serveurs, du réseau et des applications pré-installés, mais sans les données récentes. Au sinistre, on restaure depuis les sauvegardes externalisées.
Caractéristiques :
- RTO typique : 12 à 48 heures.
- RPO : 4 à 24 heures selon la fréquence des sauvegardes.
- Coût : ~ 30 % à 60 % du coût du site principal.
- Avantage : compromis coût/délai raisonnable pour la majorité des organisations.
- Inconvénient : exige une maintenance régulière (mises à jour OS, applicatifs, tests de configurations).
C'est la solution la plus répandue pour les ETI et grandes PME. Elle s'adapte bien aux fonctions critiques mais non vitales : ERP de production, CRM, applications collaboratives.
Variantes techniques :
- Site tiède virtualisé : machines virtuelles éteintes prêtes à démarrer, données en cours de réplication asynchrone.
- Site tiède containers : images Docker/Kubernetes prêtes, déploiement en quelques minutes.
- Site tiède SaaS : applications fournies en SaaS avec basculement contractuel rapide.
Site chaud et actif/actif : haute disponibilité
Le site chaud (hot site) est un site de secours totalement opérationnel en permanence, avec données répliquées en temps quasi-réel. En cas de sinistre, la bascule (failover) est automatique ou semi-automatique en quelques minutes.
Caractéristiques :
- RTO typique : 15 minutes à 4 heures.
- RPO : 0 à 15 minutes (réplication synchrone ou asynchrone fréquente).
- Coût : équivalent au coût du site principal (parfois plus en cas d'infrastructure miroir complète).
- Avantage : réactivité maximale, transparent pour la plupart des utilisateurs.
- Inconvénient : très onéreux, complexité technique élevée, exige une discipline opérationnelle stricte.
Pour les processus les plus critiques, on va jusqu'à l'architecture actif/actif (active/active) :
- Deux datacenters fonctionnent en parallèle, le trafic est réparti dynamiquement.
- En cas de panne d'un site, le second absorbe automatiquement la charge.
- RTO : 0 minutes (continuité transparente).
- RPO : 0 (réplication synchrone).
- Coût : 2 à 5 fois le coût d'un seul site.
- Usage typique : salles de marché, paiement bancaire, infrastructure cloud des hyperscalers (AWS, Azure, GCP).
Contraintes techniques actif/actif :
- Distance entre sites limitée par la latence réseau (typiquement < 50 km pour réplication synchrone) — d'où la pratique des « régions » et « zones de disponibilité » du cloud.
- Réseau redondé entre les sites avec double routage.
- Cohérence des données (théorème CAP : on choisit 2 parmi Consistency, Availability, Partition tolerance).
- Tests fréquents de bascule.
Le cloud comme stratégie de continuité
Le cloud public (AWS, Azure, GCP, OVHcloud, Scaleway, 3DS Outscale) a transformé la doctrine PCA. Il offre :
- Élasticité : ressources à la demande, paiement à l'usage.
- Redondance native : zones de disponibilité multiples par région, réplication entre régions.
- Géographies : sites disponibles dans le monde entier (mais attention à la souveraineté).
- Services managés : sauvegardes, réplication, basculement automatiques.
- Coût variable : pas d'investissement initial, mais coût récurrent.
Stratégies cloud pour la continuité :
- Backup vers le cloud : sauvegardes externalisées vers le cloud (S3, Azure Blob, GCS). RPO selon fréquence, RTO élevé (téléchargement).
- Pilot Light : minimum d'infrastructure dans le cloud (BDD répliquée, services dormants), démarrage à la demande. RTO 1-4 h.
- Warm Standby : environnement complet dans le cloud à capacité réduite, montée en charge à la bascule. RTO < 1 h.
- Multi-site Active/Active : trafic réparti entre on-premise et cloud, ou entre deux régions cloud. RTO = 0.
Souveraineté et conformité :
- SecNumCloud (label ANSSI) : qualification de haute exigence pour les données sensibles d'État. Cloud souverain certifié.
- CISPE Code de conduite : engagement européen sur la protection des données.
- HDS (Hébergeur de Données de Santé) : certification obligatoire pour héberger les données de santé.
- Loi de blocage 68-678 et FISA / Cloud Act US : risque juridique sur les clouds américains pour les données sensibles européennes — d'où la pression pour des clouds souverains européens.
- Sortie de cloud (cloud exit) : obligation DORA d'avoir un plan de réversibilité chez tout prestataire critique.
Télétravail : stratégie de continuité humaine
La pandémie COVID-19 a installé le télétravail comme la stratégie de continuité humaine par excellence. Au-delà de la crise sanitaire, il permet de faire face à :
- Inaccessibilité physique des locaux (incendie, inondation, manifestation, attentat).
- Pandémie ou épidémie nécessitant la distanciation physique.
- Conditions météo extrêmes empêchant les déplacements.
- Grève des transports (cas SNCF/RATP).
- Risque chimique ou industriel avec confinement.
Pour fonctionner comme stratégie de continuité, le télétravail demande :
- Équipement individuel : ordinateur portable (PC pro, pas BYOD), webcam, casque.
- Connectivité : VPN, ou architecture Zero Trust + SaaS sécurisé.
- Applications web : ERP, CRM, collaboratif (Microsoft 365, Google Workspace, Slack, Teams).
- Téléphonie cloud : ToIP (3CX, Aircall) pour basculer les lignes pro vers les domiciles.
- Procédures et politiques : règlement intérieur télétravail, chartes IT, gestion temps de travail, sécurité informatique.
- Formation initiale : maîtrise des outils, hygiène cybersécurité.
- Cadre juridique : accord d'entreprise ou charte sur le télétravail (article L.1222-9 du Code du travail).
Indicateur clé : la « capacité de bascule télétravail » = pourcentage des salariés capables de travailler depuis chez eux dans les 24 h. Objectif standard : ≥ 70 % pour une organisation tertiaire, plus faible pour l'industrie (où la production reste sur site).
Pour les métiers sur site obligatoirement (production, hôpital, supermarché) : prévoir des équipes de secours, des sites de repli, des rotations, et le maintien des compétences clés.
Stratégies non-IT : ne pas négliger l'humain et le physique
Trop souvent, le PCA se réduit à un PRA technique. Pour être robuste, il doit intégrer aussi :
- Continuité humaine : plans de succession, formations croisées (un poste tenu par deux personnes), documentation des savoir-faire critiques, gestion des absences imprévues.
- Continuité immobilière : locaux de repli (espaces de coworking partenaires, bureaux secondaires, salles louables ponctuellement), bureau mobile.
- Continuité fournisseurs : multi-sourcing systématique sur les composants critiques (au minimum 2 fournisseurs pour toute matière première stratégique), stocks de sécurité, contrats de continuité avec clauses SLA.
- Continuité financière : trésorerie de précaution (3 à 6 mois de charges fixes), lignes de crédit disponibles, assurances cyber et pertes d'exploitation.
- Continuité juridique : pouvoirs de signature délégués, accès aux contrats hors site, conseil juridique d'astreinte.
- Continuité logistique : transporteurs alternatifs, entrepôts de secours, flottes de véhicules.
- Continuité de la chaîne d'approvisionnement : exigence renforcée par NIS2 et DORA.
Cas pratique de continuité non-IT :
- Un fabricant alimentaire reçoit son sel marin d'un unique fournisseur breton. Suite à l'effondrement de cette usine en 2023, la production est restée à l'arrêt 3 semaines, faute d'alternatives.
- Une PME de services constate qu'une seule personne maîtrise le logiciel de paie maison. Cette personne tombe gravement malade — la paie de 200 salariés est retardée d'un mois.
- Un acteur de la logistique perd son centre de tri principal dans un incendie. Faute d'avoir prévu un site de repli, il met 6 mois à reprendre une activité nominale.
Ces exemples soulignent que la continuité d'activité est holistique — elle ne peut pas être déléguée à la seule DSI. La direction générale doit en porter la vision globale.
« Le piège classique : croire que parce qu'on a un PRA, on a une continuité d'activité. Le PRA n'est qu'une brique. Si vos employés ne peuvent pas accéder aux locaux ou si vos fournisseurs cessent leur activité, votre PRA ne sert à rien. »
— Étude AMRAE / Marsh sur la cyber-résilience, 2024
Choix d'une stratégie selon le RTO cible
| RTO cible | Stratégie recommandée | Coût relatif | Complexité |
|---|---|---|---|
| < 15 min | Actif/actif géo-distribué, cloud multi-AZ, réplication synchrone | €€€€€ | Très élevée |
| 15 min - 4 h | Site chaud + bascule automatique ou warm standby cloud | €€€€ | Élevée |
| 4 h - 24 h | Site tiède + bascule semi-auto, pilot light cloud | €€€ | Moyenne |
| 24 h - 72 h | Site tiède simple, restauration depuis sauvegardes | €€ | Faible |
| > 72 h | Site froid ou simple sauvegarde externalisée + reconstruction | € | Très faible |
À retenir
- 4 types de sites : froid (1-7 j, €), tiède (12-48 h, €€), chaud (15 min-4 h, €€€), actif/actif (0-15 min, €€€€).
- Distance minimale entre sites de secours : 30 km (ANSSI non-OIV), 200 km (OIV).
- Cloud comme stratégie PCA : Backup, Pilot Light, Warm Standby, Multi-site. Souveraineté : SecNumCloud (ANSSI), HDS (santé), Cloud Act US à anticiper.
- Télétravail = continuité humaine (cible ≥ 70 % de capacité de bascule tertiaire). VPN, applications web, téléphonie cloud, cadre juridique.
- PCA holistique : continuité non-IT (humaine, immobilière, fournisseurs, financière, juridique, logistique) — ne pas se limiter au PRA.
- Risque de concentration cloud : AWS 33 %, Azure 24 %, GCP 11 %. Diversification multi-cloud pour les acteurs critiques.