Incident & retour d'expérience Résolu — retour nominal

Incident de refroidissement Equinix PA4 : notre gestion de continuité

Résolu
État de l'incident
24/06 · 15 h 06
Début (heure locale)
Aucune perte
Données clients
PA4 · Pantin
Site concerné

Le 24 juin 2026 à 15 h 06, un incident de refroidissement est survenu au datacenter Equinix PA4 (Pantin), l'un des trois sites sur lesquels nous opérons notre infrastructure. Cet incident relève de notre datacenter, pas de nos équipements. Nous publions ici, en toute transparence, la manière dont nous l'avons géré.

Notre priorité a été simple : préserver le matériel et les données plutôt que de maintenir coûte que coûte des services dans des conditions environnementales dégradées. Nos services sont revenus en fonctionnement nominal le 25 juin à 8 h 30, redondance comprise. Côté datacenter, une seule unité de refroidissement reste à remettre à pleine capacité (un groupe froid à 50 %, en attente de pièces).

En résumé

Une défaillance d'alimentation en eau du système de refroidissement adiabatique d'Equinix PA4 a provoqué l'arrêt de protection de plusieurs groupes froids et une montée des températures en salle. Conformément à notre plan de gestion d'incident, et après concertation avec les clients concernés, nous avons basculé les services redondants sur leur PCA, migré les machines mono-site entre clusters lorsque c'était possible, puis procédé à un arrêt contrôlé de la très grande majorité de nos équipements PA4. Aucune perte de données ni arrêt non maîtrisé n'a été constaté.

Chronologie

HorodatageÉvénement
24/06 · 15 h 06Détection de l'incident de climatisation à Equinix PA4 (perte d'alimentation en eau du refroidissement adiabatique).
24/06 · ~16 h 00Début de la montée des températures dans les salles.
24/06 · 20 h 30Atteinte de nos paliers d'alarme thermique. Activation du plan de gestion d'incident.
24/06 · 20 h 30 – 22 h 30Information des clients concernés, puis avec leur accord : arrêt des machines en veille, bascule de machines actives sur leur PCA, migration inter-clusters des machines mono-datacenter.
24/06 · 22 h 30Arrêt contrôlé de la très grande majorité de nos équipements PA4 pour préserver le matériel.
25/06 · matinéeRefroidissement suffisamment rétabli côté datacenter (majorité des groupes froids relancés, un à capacité réduite), redondance encore réduite.
25/06 · 07 h 30Température jugée suffisamment stable : début du redémarrage et de la reprise progressive de nos services.
25/06 · 08 h 30Retour en fonctionnement nominal de l'ensemble de nos services — fin de l'incident côté RDEM Systems.
Côté datacenterRedondance rétablie côté datacenter ; cinq groupes froids à pleine capacité, un à 50 % (en attente de pièces) avant retour à la pleine capacité de refroidissement.

Impact réseau : l'un de nos transitaires présents sur PA4 a vu son équipement s'éteindre en raison de la température. Grâce à notre raccordement multi-sites et multi-transitaires via notre AS206014, le trafic a continué d'être acheminé par nos autres points de présence, sans coupure de connectivité.

Notre réponse

Notre architecture sur trois datacenters Equinix interconnectés nous a donné des options de continuité réelles. Voici ce que nous avons activé :

Bascule PCA

Les services disposant d'un plan de continuité ont été basculés vers leur site de secours, hors de PA4.

Migration inter-clusters

Pour les machines mono-datacenter, migration vers d'autres clusters lorsque la situation le permettait, afin de maintenir le service.

Arrêt contrôlé

Extinction propre et ordonnée du reste des équipements PA4, pour éviter tout dommage matériel lié à la chaleur.

Ce que cet incident illustre

Une supervision thermique avec des paliers d'alarme définis à l'avance, et non subis.

Une décision proactive : préserver le matériel plutôt que de courir le risque d'une panne incontrôlée.

Une communication avec les clients avant d'agir, et non après.

Des options de continuité réelles grâce à une architecture multi-datacenters.

Cause de l'incident

D'après les communications de notre datacenter, la cause initiale suspectée est une perte d'alimentation en eau du système de refroidissement adiabatique, ayant entraîné des conditions de haute pression et l'arrêt de protection des compresseurs de plusieurs groupes froids. Les interventions de remise en service et de réparation sont en cours côté Equinix.

Nous ne reproduisons pas ici le détail opérationnel interne du datacenter. La cause racine consolidée (RCA) sera publiée une fois disponible et confirmée.

Notre engagement de transparence

  • Nous ne déclarons « aucun impact » que lorsque c'est objectivement vrai pour les clients concernés.
  • Le 25 juin, nos services PA4 sont revenus en fonctionnement nominal à 8 h 30, redondance comprise ; un groupe froid reste à remettre à pleine capacité côté datacenter.
  • Cette page est mise à jour à mesure de l'évolution de la situation.

Une infrastructure pensée pour la continuité

Trois datacenters Equinix interconnectés, des clusters en haute disponibilité et des procédures d'incident éprouvées. Parlons de la résilience de votre infrastructure.

Contact

Adresse

5 B RUE DES NOYERS, 95300 PONTOISE, FRANCE

Téléphone

01 77 62 42 42

Parlons de votre projet

15 minutes pour comprendre vos besoins, sans engagement.

Réservez un créneau