2025年5月12日、ECSO CLOUDは、ケルンにある当社の主要データセンターに影響を及ぼす大規模なネットワーク障害に見舞われました。この障害は、外部の建設工事により当社の主要光ファイバーバックボーンが完全に切断されたことが原因でした。冗長化プロトコルは整備されていましたが、代替経路への極端なトラフィック負荷により、完全な復旧が遅れました。本レポートでは、タイムライン、直面した技術的課題、およびサービス復旧のために講じた措置について概説します。
インシデントの概要
中央ヨーロッパ時間(CET)19時08分、当社の監視システムが、ケルンハブにおける接続の完全な喪失をネットワークオペレーションセンター(NOC)に通知しました。原因は、当社の主要な100TB容量の光ファイバー回線の物理的損傷であることが直ちに特定されました。 この損傷は、当社のインフラ周辺でドイツ鉄道(Deutsche Bahn)が実施していた拡張工事中に発生しました。
事象のタイムライン
5月12日 19:08 ケルンにて最初のネットワーク障害が発生。
5月12日 19:11 お客様への通知を送信 - 緊急対応チームを
派遣。
5月12日 19:15 シカゴおよび東京のバックアップ回線への自動フェイルオーバーを
開始。
5月12日 20:33 セカンダリバックアップ回線による手動バイパスを完了;サービスが
復旧し始めました。
5月13日 12:34 プライマリ光ファイバー回線の物理的な修復が完了し、テストを実施。
技術的分析と対応
通常の運用環境下では、当社のグローバルメッシュネットワークは、シカゴおよび東京の国際ノードを経由してトラフィックを迂回させるよう設計されています。 しかし、今回の事象発生時、これらのバックアップ経路の利用率が前例のない急増を見せ、輻輳が発生したため、ケルンからのトラフィックを完全に吸収することができませんでした。
この状況を緩和するため、現地エンジニアが追加のローカルバックアップ回線の展開と設定に取り組みました。20:33までにこの回線が稼働し、サービスの状況は徐々に安定し、大多数のユーザー様においてサービスが復旧しました。
今後の取り組み
ECSO CLOUDは、最高水準の信頼性を確保することに全力を尽くしています。 現在、当社はセカンダリ回線の容量を見直しており、プライマリ回線が完全にダウンした場合でも、パフォーマンスの低下なく、国際ノードによって地域ごとのトラフィックを完全に維持できるよう確保しています。物理的な修復作業は5月13日12時34分に完了し、現在すべてのシステムは100%の容量で稼働しています。
今回のサービス停止によりご不便をおかけしましたことを心よりお詫び申し上げます。また、復旧作業中にお客様にご理解とご協力いただきましたことに感謝いたします。 もっと知りたいですか?
当社について詳しくは、当社の「会社概要」ページをご覧ください。
当社について