Le 24 juin 2026 à 15 h 06, un incident de refroidissement est survenu au datacenter Equinix PA4 (Pantin), l'un des trois sites sur lesquels nous opérons notre infrastructure. Cet incident relève de notre datacenter, pas de nos équipements. Nous publions ici, en toute transparence, la manière dont nous l'avons géré.
Notre priorité a été simple : préserver le matériel et les données plutôt que de maintenir coûte que coûte des services dans des conditions environnementales dégradées. Nos services sont revenus en fonctionnement nominal le 25 juin à 8 h 30, redondance comprise. Côté datacenter, une seule unité de refroidissement reste à remettre à pleine capacité (un groupe froid à 50 %, en attente de pièces).
En résumé
Une défaillance d'alimentation en eau du système de refroidissement adiabatique d'Equinix PA4 a provoqué l'arrêt de protection de plusieurs groupes froids et une montée des températures en salle. Conformément à notre plan de gestion d'incident, et après concertation avec les clients concernés, nous avons basculé les services redondants sur leur PCA, migré les machines mono-site entre clusters lorsque c'était possible, puis procédé à un arrêt contrôlé de la très grande majorité de nos équipements PA4. Aucune perte de données ni arrêt non maîtrisé n'a été constaté.
Chronologie
| Horodatage | Événement |
|---|---|
| 24/06 · 15 h 06 | Détection de l'incident de climatisation à Equinix PA4 (perte d'alimentation en eau du refroidissement adiabatique). |
| 24/06 · ~16 h 00 | Début de la montée des températures dans les salles. |
| 24/06 · 20 h 30 | Atteinte de nos paliers d'alarme thermique. Activation du plan de gestion d'incident. |
| 24/06 · 20 h 30 – 22 h 30 | Information des clients concernés, puis avec leur accord : arrêt des machines en veille, bascule de machines actives sur leur PCA, migration inter-clusters des machines mono-datacenter. |
| 24/06 · 22 h 30 | Arrêt contrôlé de la très grande majorité de nos équipements PA4 pour préserver le matériel. |
| 25/06 · matinée | Refroidissement suffisamment rétabli côté datacenter (majorité des groupes froids relancés, un à capacité réduite), redondance encore réduite. |
| 25/06 · 07 h 30 | Température jugée suffisamment stable : début du redémarrage et de la reprise progressive de nos services. |
| 25/06 · 08 h 30 | Retour en fonctionnement nominal de l'ensemble de nos services — fin de l'incident côté RDEM Systems. |
| Côté datacenter | Redondance rétablie côté datacenter ; cinq groupes froids à pleine capacité, un à 50 % (en attente de pièces) avant retour à la pleine capacité de refroidissement. |
Impact réseau : l'un de nos transitaires présents sur PA4 a vu son équipement s'éteindre en raison de la température. Grâce à notre raccordement multi-sites et multi-transitaires via notre AS206014, le trafic a continué d'être acheminé par nos autres points de présence, sans coupure de connectivité.
Notre réponse
Notre architecture sur trois datacenters Equinix interconnectés nous a donné des options de continuité réelles. Voici ce que nous avons activé :
Bascule PCA
Les services disposant d'un plan de continuité ont été basculés vers leur site de secours, hors de PA4.
Migration inter-clusters
Pour les machines mono-datacenter, migration vers d'autres clusters lorsque la situation le permettait, afin de maintenir le service.
Arrêt contrôlé
Extinction propre et ordonnée du reste des équipements PA4, pour éviter tout dommage matériel lié à la chaleur.
Ce que cet incident illustre
Une supervision thermique avec des paliers d'alarme définis à l'avance, et non subis.
Une décision proactive : préserver le matériel plutôt que de courir le risque d'une panne incontrôlée.
Une communication avec les clients avant d'agir, et non après.
Des options de continuité réelles grâce à une architecture multi-datacenters.
Cause de l'incident
D'après les communications de notre datacenter, la cause initiale suspectée est une perte d'alimentation en eau du système de refroidissement adiabatique, ayant entraîné des conditions de haute pression et l'arrêt de protection des compresseurs de plusieurs groupes froids. Les interventions de remise en service et de réparation sont en cours côté Equinix.
Nous ne reproduisons pas ici le détail opérationnel interne du datacenter. La cause racine consolidée (RCA) sera publiée une fois disponible et confirmée.
Notre engagement de transparence
- Nous ne déclarons « aucun impact » que lorsque c'est objectivement vrai pour les clients concernés.
- Le 25 juin, nos services PA4 sont revenus en fonctionnement nominal à 8 h 30, redondance comprise ; un groupe froid reste à remettre à pleine capacité côté datacenter.
- Cette page est mise à jour à mesure de l'évolution de la situation.
Une infrastructure pensée pour la continuité
Trois datacenters Equinix interconnectés, des clusters en haute disponibilité et des procédures d'incident éprouvées. Parlons de la résilience de votre infrastructure.