Immagine AI

Lunedì scorso ci siamo svegliati in una versione amplificata di “quando Internet si prende un giorno libero”. Una vasta interruzione dei servizi di AWS ha colpito non solo l’infrastruttura di fondo della piattaforma, ma ha avuto ripercussioni immediate su numerose app e servizi che usiamo quotidianamente. Tra i “colpiti” troviamo nomi importanti: Perplexity AI, Snapchat, Canva, Duolingo e molti altri, fino a includere dispositivi smart-home e piattaforme finanziarie come Robinhood e Venmo.

L’interruzione è avvenuta nella regione US-EAST-1 (Virginia settentrionale), una delle zone maggiormente critiche dell’infrastruttura di AWS. Secondo la pagina ufficiale di status, l’azienda ha registrato “aumento dei tassi di errore e latenza” per diversi suoi servizi core.

In concreto, intorno alle 12:30 IST (circa mattina nelle Americhe), si è visto un rapido aumento delle segnalazioni di malfunzionamento: log-in che non vanno a buon fine, servizi smart che non rispondono, app che si bloccano o non si caricano affatto.

Un esempio emblematico è quello di Perplexity AI: il CEO ­– Aravind Srinivas – ha confermato su X che “il problema è un issue di AWS, stiamo lavorando per risolverlo”. I componenti di AWS maggiormente coinvolti includono EC2, DynamoDB e Global Accelerator, ossia servizi fondamentali per hosting, database e distribuzione globale delle applicazioni.

Questo episodio non è solo un “black-out” digitale: mette in evidenza quanto siamo ormai intrecciati con pochi grandi fornitori infrastrutturali e quanto fragili siano, in ultima analisi, anche servizi che appaiono “invulnerabili”. Quando una regione critica di AWS va in difficoltà, l’effetto a catena colpisce non solamente le “piccole” app, ma anche quelle che pensavamo potessero reggere qualunque urto.

Inoltre, è rilevante che anche gli stessi strumenti interni di Amazon abbiano subito rallentamenti: questo testimonia che non c’è un “super-scudo” interno che impedisca alla società di essere colpita allo stesso tempo in cui colpisce altri.

Per l’utente medio, il risultato è stato semplice da capire: apri un’app e… niente risposta. La fotocamera intelligente di casa che non si connette, la chat che non si invia, l’app che sembra caricarsi per sempre. Ma per chi gestisce un business online, per chi pubblica contenuti in tempo reale, o per chi dipende dai servizi cloud per transazioni o backend, l’impatto è ben più grave: perdita di vendite, reputazione, affidabilità verso i clienti.

Ad esempio, piattaforme di streaming, social network o tool di creazione grafica (pensiamo a Canva) si sono trovati in difficoltà operativa, anche se il “core” del malfunzionamento era a monte. Questo crea una sorta di “effetto domino” invisibile: tu utenti finali vedi la “app che non funziona”, ma la causa è mesi di dipendenza infrastrutturale che non era ben “coperta”.

Nel breve termine, AWS probabilmente effettuerà un’analisi approfondita delle cause, comunicherà le misure esplicite per evitare recidive, e forse modificherà procedure interne o infrastrutture. Dal lato dei clienti (app, piattaforme, servizi), vedremo sicuramente domande più spinte sugli SLA, sui piani di backup e sulla diversità delle regioni.

Nel medio-lungo periodo, questo tipo di evento rafforza la nascita e l’adozione di architetture distribuite, che non dipendono “solo da Virginia”, “solo da Sing-apore”, o “solo da un data-center”. La logica del “sempre-on” e della latenza bassa costringerà molti ad adottare approcci ibridi o multi-provider.

Da parte degli utenti, la fiducia verso il “cloud che funziona sempre” riceverà una scossa. Forse non dirompente, ma sufficiente a farci riflettere ogni volta che un’app “non si apre”: magari non è un problema del tuo telefono.

Di Fantasy