PCA / PRA & Continuité d'Activité

Formation PCA / PRA — Continuité d'Activité

Module 2 : Analyse des risques & BIA

Module 2 : BIA & risques 23 min de lecture

2.3 Choisir sa stratégie de continuité

Le BIA fixe les objectifs (RTO, RPO). La cartographie identifie les menaces. Reste à choisir les bonnes stratégies pour atteindre les objectifs face aux menaces. Sites froid/tiède/chaud/actif, cloud, télétravail : panorama des options et de leurs coûts.

Les 4 types de sites de secours informatique
Site Froid

Local + élec uniquement
RTO : 1-7 jours
Coût : €

Site Tiède

Serveurs + réseau prêts
RTO : 12-48 h
Coût : €€

Site Chaud

Données répliquées
RTO : 1-4 h
Coût : €€€

Actif/Actif

Trafic réparti en continu
RTO : 0-15 min
Coût : €€€€

1

Site froid : la solution low-cost

Un site froid (cold site) est un local de secours équipé uniquement de l'infrastructure de base : alimentation électrique, climatisation, réseau, mais sans serveurs ni données pré-installés. Tout doit être reconstruit après le sinistre.

Caractéristiques :

  • RTO typique : 1 à 7 jours (le temps de livrer, installer, configurer les équipements et restaurer les données).
  • RPO : déterminé par la fréquence des sauvegardes externalisées (typiquement 24 h).
  • Coût : ~ 5 000 à 20 000 €/mois selon la surface louée.
  • Avantage : économique pour les organisations dont les processus tolèrent un arrêt prolongé.
  • Inconvénient : très dépendant de la disponibilité d'équipements de remplacement (rupture chaîne d'approvisionnement = retard).

Cas d'usage typiques : administrations communales, cabinets d'experts-comptables, PME sans contrainte temps réel, fonctions support (RH, paie, archivage).

Le site froid est parfois loué chez un prestataire spécialisé (Equinix, Interxion, Stago) qui propose des « salles blanches » mutualisées équipées du minimum.

« Le site froid reste pertinent pour les organisations qui priorisent un coût bas. Mais les délais sont rarement compatibles avec les exigences RGPD/NIS2 de notification rapide. »

— Cabinet Wavestone, étude continuité 2024
2

Site tiède : le compromis raisonnable

Un site tiède (warm site) dispose des serveurs, du réseau et des applications pré-installés, mais sans les données récentes. Au sinistre, on restaure depuis les sauvegardes externalisées.

Caractéristiques :

  • RTO typique : 12 à 48 heures.
  • RPO : 4 à 24 heures selon la fréquence des sauvegardes.
  • Coût : ~ 30 % à 60 % du coût du site principal.
  • Avantage : compromis coût/délai raisonnable pour la majorité des organisations.
  • Inconvénient : exige une maintenance régulière (mises à jour OS, applicatifs, tests de configurations).

C'est la solution la plus répandue pour les ETI et grandes PME. Elle s'adapte bien aux fonctions critiques mais non vitales : ERP de production, CRM, applications collaboratives.

Variantes techniques :

  • Site tiède virtualisé : machines virtuelles éteintes prêtes à démarrer, données en cours de réplication asynchrone.
  • Site tiède containers : images Docker/Kubernetes prêtes, déploiement en quelques minutes.
  • Site tiède SaaS : applications fournies en SaaS avec basculement contractuel rapide.
3

Site chaud et actif/actif : haute disponibilité

Le site chaud (hot site) est un site de secours totalement opérationnel en permanence, avec données répliquées en temps quasi-réel. En cas de sinistre, la bascule (failover) est automatique ou semi-automatique en quelques minutes.

Caractéristiques :

  • RTO typique : 15 minutes à 4 heures.
  • RPO : 0 à 15 minutes (réplication synchrone ou asynchrone fréquente).
  • Coût : équivalent au coût du site principal (parfois plus en cas d'infrastructure miroir complète).
  • Avantage : réactivité maximale, transparent pour la plupart des utilisateurs.
  • Inconvénient : très onéreux, complexité technique élevée, exige une discipline opérationnelle stricte.

Pour les processus les plus critiques, on va jusqu'à l'architecture actif/actif (active/active) :

  • Deux datacenters fonctionnent en parallèle, le trafic est réparti dynamiquement.
  • En cas de panne d'un site, le second absorbe automatiquement la charge.
  • RTO : 0 minutes (continuité transparente).
  • RPO : 0 (réplication synchrone).
  • Coût : 2 à 5 fois le coût d'un seul site.
  • Usage typique : salles de marché, paiement bancaire, infrastructure cloud des hyperscalers (AWS, Azure, GCP).

Contraintes techniques actif/actif :

  • Distance entre sites limitée par la latence réseau (typiquement < 50 km pour réplication synchrone) — d'où la pratique des « régions » et « zones de disponibilité » du cloud.
  • Réseau redondé entre les sites avec double routage.
  • Cohérence des données (théorème CAP : on choisit 2 parmi Consistency, Availability, Partition tolerance).
  • Tests fréquents de bascule.
Distances minimales : ANSSI recommande au minimum 30 km entre sites de secours pour les organisations non OIV (200 km pour les OIV). C'est pour éviter qu'un sinistre régional (tempête, inondation, panne ENEDIS) frappe simultanément les deux sites.
— Publicité —
4

Le cloud comme stratégie de continuité

Le cloud public (AWS, Azure, GCP, OVHcloud, Scaleway, 3DS Outscale) a transformé la doctrine PCA. Il offre :

  • Élasticité : ressources à la demande, paiement à l'usage.
  • Redondance native : zones de disponibilité multiples par région, réplication entre régions.
  • Géographies : sites disponibles dans le monde entier (mais attention à la souveraineté).
  • Services managés : sauvegardes, réplication, basculement automatiques.
  • Coût variable : pas d'investissement initial, mais coût récurrent.

Stratégies cloud pour la continuité :

  • Backup vers le cloud : sauvegardes externalisées vers le cloud (S3, Azure Blob, GCS). RPO selon fréquence, RTO élevé (téléchargement).
  • Pilot Light : minimum d'infrastructure dans le cloud (BDD répliquée, services dormants), démarrage à la demande. RTO 1-4 h.
  • Warm Standby : environnement complet dans le cloud à capacité réduite, montée en charge à la bascule. RTO < 1 h.
  • Multi-site Active/Active : trafic réparti entre on-premise et cloud, ou entre deux régions cloud. RTO = 0.

Souveraineté et conformité :

  • SecNumCloud (label ANSSI) : qualification de haute exigence pour les données sensibles d'État. Cloud souverain certifié.
  • CISPE Code de conduite : engagement européen sur la protection des données.
  • HDS (Hébergeur de Données de Santé) : certification obligatoire pour héberger les données de santé.
  • Loi de blocage 68-678 et FISA / Cloud Act US : risque juridique sur les clouds américains pour les données sensibles européennes — d'où la pression pour des clouds souverains européens.
  • Sortie de cloud (cloud exit) : obligation DORA d'avoir un plan de réversibilité chez tout prestataire critique.
Risque concentration cloud : AWS détient ~ 33 % du marché cloud mondial, Azure ~ 24 %, GCP ~ 11 %. Cette concentration pose un risque systémique. La pression réglementaire (DORA, NIS2) pousse à la diversification multi-cloud, surtout pour les acteurs critiques.
5

Télétravail : stratégie de continuité humaine

La pandémie COVID-19 a installé le télétravail comme la stratégie de continuité humaine par excellence. Au-delà de la crise sanitaire, il permet de faire face à :

  • Inaccessibilité physique des locaux (incendie, inondation, manifestation, attentat).
  • Pandémie ou épidémie nécessitant la distanciation physique.
  • Conditions météo extrêmes empêchant les déplacements.
  • Grève des transports (cas SNCF/RATP).
  • Risque chimique ou industriel avec confinement.

Pour fonctionner comme stratégie de continuité, le télétravail demande :

  • Équipement individuel : ordinateur portable (PC pro, pas BYOD), webcam, casque.
  • Connectivité : VPN, ou architecture Zero Trust + SaaS sécurisé.
  • Applications web : ERP, CRM, collaboratif (Microsoft 365, Google Workspace, Slack, Teams).
  • Téléphonie cloud : ToIP (3CX, Aircall) pour basculer les lignes pro vers les domiciles.
  • Procédures et politiques : règlement intérieur télétravail, chartes IT, gestion temps de travail, sécurité informatique.
  • Formation initiale : maîtrise des outils, hygiène cybersécurité.
  • Cadre juridique : accord d'entreprise ou charte sur le télétravail (article L.1222-9 du Code du travail).

Indicateur clé : la « capacité de bascule télétravail » = pourcentage des salariés capables de travailler depuis chez eux dans les 24 h. Objectif standard : ≥ 70 % pour une organisation tertiaire, plus faible pour l'industrie (où la production reste sur site).

Pour les métiers sur site obligatoirement (production, hôpital, supermarché) : prévoir des équipes de secours, des sites de repli, des rotations, et le maintien des compétences clés.

— Publicité —
6

Stratégies non-IT : ne pas négliger l'humain et le physique

Trop souvent, le PCA se réduit à un PRA technique. Pour être robuste, il doit intégrer aussi :

  • Continuité humaine : plans de succession, formations croisées (un poste tenu par deux personnes), documentation des savoir-faire critiques, gestion des absences imprévues.
  • Continuité immobilière : locaux de repli (espaces de coworking partenaires, bureaux secondaires, salles louables ponctuellement), bureau mobile.
  • Continuité fournisseurs : multi-sourcing systématique sur les composants critiques (au minimum 2 fournisseurs pour toute matière première stratégique), stocks de sécurité, contrats de continuité avec clauses SLA.
  • Continuité financière : trésorerie de précaution (3 à 6 mois de charges fixes), lignes de crédit disponibles, assurances cyber et pertes d'exploitation.
  • Continuité juridique : pouvoirs de signature délégués, accès aux contrats hors site, conseil juridique d'astreinte.
  • Continuité logistique : transporteurs alternatifs, entrepôts de secours, flottes de véhicules.
  • Continuité de la chaîne d'approvisionnement : exigence renforcée par NIS2 et DORA.

Cas pratique de continuité non-IT :

  • Un fabricant alimentaire reçoit son sel marin d'un unique fournisseur breton. Suite à l'effondrement de cette usine en 2023, la production est restée à l'arrêt 3 semaines, faute d'alternatives.
  • Une PME de services constate qu'une seule personne maîtrise le logiciel de paie maison. Cette personne tombe gravement malade — la paie de 200 salariés est retardée d'un mois.
  • Un acteur de la logistique perd son centre de tri principal dans un incendie. Faute d'avoir prévu un site de repli, il met 6 mois à reprendre une activité nominale.

Ces exemples soulignent que la continuité d'activité est holistique — elle ne peut pas être déléguée à la seule DSI. La direction générale doit en porter la vision globale.

« Le piège classique : croire que parce qu'on a un PRA, on a une continuité d'activité. Le PRA n'est qu'une brique. Si vos employés ne peuvent pas accéder aux locaux ou si vos fournisseurs cessent leur activité, votre PRA ne sert à rien. »

— Étude AMRAE / Marsh sur la cyber-résilience, 2024
Choix d'une stratégie selon le RTO cible
RTO cibleStratégie recommandéeCoût relatifComplexité
< 15 minActif/actif géo-distribué, cloud multi-AZ, réplication synchrone€€€€€Très élevée
15 min - 4 hSite chaud + bascule automatique ou warm standby cloud€€€€Élevée
4 h - 24 hSite tiède + bascule semi-auto, pilot light cloud€€€Moyenne
24 h - 72 hSite tiède simple, restauration depuis sauvegardes€€Faible
> 72 hSite froid ou simple sauvegarde externalisée + reconstructionTrès faible
À retenir
  • 4 types de sites : froid (1-7 j, €), tiède (12-48 h, €€), chaud (15 min-4 h, €€€), actif/actif (0-15 min, €€€€).
  • Distance minimale entre sites de secours : 30 km (ANSSI non-OIV), 200 km (OIV).
  • Cloud comme stratégie PCA : Backup, Pilot Light, Warm Standby, Multi-site. Souveraineté : SecNumCloud (ANSSI), HDS (santé), Cloud Act US à anticiper.
  • Télétravail = continuité humaine (cible ≥ 70 % de capacité de bascule tertiaire). VPN, applications web, téléphonie cloud, cadre juridique.
  • PCA holistique : continuité non-IT (humaine, immobilière, fournisseurs, financière, juridique, logistique) — ne pas se limiter au PRA.
  • Risque de concentration cloud : AWS 33 %, Azure 24 %, GCP 11 %. Diversification multi-cloud pour les acteurs critiques.
Sommaire de la formation