Logo Epoch Times
Panne web mondiale

Panne géante du cloud Amazon : les entreprises face à leur dépendance

La filiale d’Amazon, Amazon Web Services (AWS), première plateforme mondiale de cloud computing, a annoncé avoir résolu dans la nuit de lundi à mardi une vaste panne qui a paralysé de nombreux services et applications en ligne pendant près de quinze heures.

top-article-image

Lors de la conférence AWS re:Invent 2024 organisée par Amazon Web Services au Venetian Las Vegas, le 3 décembre 2024 à Las Vegas aux États-Unis.

Photo: Noah Berger/Getty Images pour Amazon Web Services

author-image
Partager un article

Durée de lecture: 4 Min.

Peu après 7h00 GMT, des dysfonctionnements ont été détectés dans des centres de données historiques d’AWS situés près de Washington. Cette défaillance s’est traduite par des interruptions ou de fortes perturbations touchant une part importante d’Internet mondial : services bancaires, plateformes de jeux en ligne comme Fortnite et Roblox, outils de visioconférence tels que Zoom, ainsi que des sites de streaming comme Disney+, Prime Video, ou encore Airbnb et Snapchat.

Selon AWS, « tous les services sont revenus à la normale vers 22h00 GMT », malgré « une file d’attente de quelques heures » pour résoudre des processus techniques secondaires.

Dépendance mondiale à l’égard des infrastructures américaines du cloud

AWS domine près d’un tiers du marché mondial du cloud, devant Microsoft Azure et Google Cloud, qui se partagent ensemble le second tiers, selon Synergy Research Group. Sa position dominante renforce cependant les inquiétudes sur la concentration de la gestion des données et des infrastructures.

L’incident a provoqué des blocages de paiements, des livraisons interrompues et des arrêts d’activités professionnelles ou privées, illustrant la dépendance mondiale à l’égard des infrastructures américaines du cloud. En Europe, la situation semblait stabilisée dès 15h00 GMT, mais aux États-Unis, des milliers d’utilisateurs ont continué à signaler des difficultés via le site Downdetector, notamment avec le jeu Battlefield, le site de la compagnie aérienne Delta et le service de paiement Venmo.

La réputation des marques menacées

L’analyste britannique Michael Hewson a jugé que cette panne soulève « de sérieuses questions » quant à la pertinence pour les entreprises « d’externaliser tout ou partie de leur infrastructure essentielle à un petit groupe de fournisseurs tiers afin de réaliser des économies sur l’hébergement ».

De son côté, Gadjo Sevilla, analyste chez Emarketer, a estimé que « cette dépendance excessive à l’égard d’un seul fournisseur menace désormais plus que la simple disponibilité des services : elle met en péril la réputation de la marque et la confiance des clients ». Selon lui, les entreprises doivent désormais envisager des stratégies de redondance, impliquant des coûts financiers et énergétiques supplémentaires.

Origine technique de l’incident

AWS a indiqué sur son site de maintenance que le déclencheur de la panne provenait d’un problème de DNS — le système d’annuaire des noms de domaines — dont la cause exacte reste à déterminer. Ce dysfonctionnement a affecté l’accès à la base de données DynamoDB, utilisée par de nombreuses applications. Bien que rétabli en deux heures, il a entraîné en cascade une panne des serveurs EC2, essentiels pour fournir mémoire et puissance de calcul aux entreprises. « Le système de vérification des répartiteurs de charge réseau a également été affecté », a précisé l’entreprise, comparant la situation à une tour de contrôle frappée par une défaillance de navigation.

Failles structurelles persistantes

AWS a mis en place une quarantaine de régions distinctes à travers le monde, chacune disposant de trois structures indépendantes censées limiter les effets d’une panne. Cependant, de nombreuses requêtes essentielles — comme celles du système IAM, chargé de l’authentification des utilisateurs — continuent de dépendre de la région historique US-East-1, créée en 2006 et située en Virginie du Nord.

Un précédent mondial

Cette nouvelle perturbation survient un an après une autre panne majeure, en juillet 2024, liée à une mise à jour défectueuse du logiciel de cybersécurité CrowdStrike sur Windows, qui avait paralysé des hôpitaux, aéroports et entreprises dans le monde entier. Microsoft avait alors estimé que 8,5 millions d’appareils avaient été touchés, confrontant leurs utilisateurs à des « écrans bleus de la mort » rendant le redémarrage impossible.