Le 12 mai 2025, ECSO CLOUD a subi une panne réseau majeure qui a touché notre centre de données principal situé à Cologne. Cette interruption a été causée par des travaux de construction externes qui ont entraîné une coupure totale de notre réseau dorsal principal à fibre optique. Bien que des protocoles de redondance aient été mis en place, des charges de trafic extrêmes sur les routes secondaires ont retardé le rétablissement complet des services. Ce rapport présente la chronologie des événements, les défis techniques rencontrés et les mesures prises pour rétablir les services.
L'incident
À 19 h 08 CET, nos systèmes de surveillance ont alerté le Centre d'exploitation du réseau (NOC) d'une perte totale de connectivité au niveau du hub de Cologne. La cause a été rapidement identifiée comme étant un dommage physique sur notre ligne de fibre optique principale d'une capacité de 100 To. Ces dommages se sont produits lors de travaux d'extension menés par la Deutsche Bahn (Chemins de fer allemands) à proximité de notre infrastructure.
Chronologie des événements
12 mai, 19 h 08 : première panne du réseau à Cologne.
12 mai, 19 h 11 : notifications envoyées aux clients - équipes d'intervention d'urgence
déployées.
12 mai, 19 h 15 : basculement automatique vers les lignes de secours à Chicago et Tokyo
lancé.
12 mai, 20 h 33 : contournement manuel via la ligne de secours secondaire effectué ; les services
ont commencé à être rétablis.
13 mai, 12 h 34 Réparations physiques de la ligne fibre optique principale terminées et testées.
Analyse technique et réponse
Dans des conditions de fonctionnement normales, notre réseau maillé mondial est conçu pour rediriger le trafic via nos nœuds internationaux à Chicago et Tokyo. Cependant, pendant cette période spécifique, ces routes de secours ont connu une augmentation sans précédent de leur utilisation, entraînant une congestion qui les a empêchées d'absorber entièrement le trafic de Cologne.
Pour pallier cela, nos ingénieurs sur site ont travaillé au déploiement et à la configuration d'un circuit de secours localisé supplémentaire. À 20 h 33, ce circuit était opérationnel, permettant aux services de se stabiliser progressivement et de revenir en ligne pour la majorité de nos utilisateurs.
Perspectives d'avenir
ECSO CLOUD s'engage à respecter les normes de fiabilité les plus élevées. Nous examinons actuellement les capacités de nos lignes secondaires afin de garantir que, même en cas de défaillance totale de la ligne principale, le trafic régional puisse être entièrement pris en charge par nos nœuds internationaux sans dégradation des performances. Les travaux de réparation physique ont été achevés le 13 mai à 12 h 34, et tous les systèmes fonctionnent actuellement à 100 % de leur capacité.
Nous vous présentons nos sincères excuses pour la gêne occasionnée par cette interruption et remercions nos clients pour leur patience pendant le processus de rétablissement.
Écrit par
Luke Barwanietz
Chief People & Operations Officer
Vous souhaitez en savoir plus ?
Vous pouvez en savoir plus sur nous sur notre page À propos.
En savoir plus sur nous