Il mondo digitale si è trovato ancora una volta a fare i conti con un’improvvisa fragilità delle infrastrutture: nel corso della recente grande interruzione globale di AWS, gli ingegneri di New Relic sono riusciti a individuare il problema 27 minuti prima che AWS stesso lo comunicasse ai propri clienti. Il dato, emerso nelle parole di Rob Newell — Senior Vice President e General Manager per Asia Pacifico & Giappone presso New Relic — non è un mera curiosità tecnica: riflette una realtà inquietante ma sempre più comune: la rete globale e i servizi che ne dipendono non sono più solo “strumenti che funzionano”, ma sistemi tanto complessi quanto fragili, eppure critici per intere imprese in tempo reale.
Gli eventi recenti lo dimostrano: pochi mesi dopo che il mondo digitale era rimasto paralizzato da un attacco a CrowdStrike, un altro attore chiave come Cloudflare ha subito una perdita di servizio globale che ha colpito siti come Spotify, ChatGPT, X e altri. Il ripetersi di tali blackout pone problemi enormi: secondo la previsione “Observability Forecast 2025” citata dall’articolo, per le aziende indiane le interruzioni di grande impatto possono costare tra 1 e 3 milioni di dollari all’ora. Considerando che si entra nel periodo dell’anno ad alta domanda (Black Friday, shopping online, eccetera), l’effetto moltiplicatore di queste rotture è destinato a diventare drammatico.
In questo contesto New Relic afferma di voler affrontare il problema su due fronti: da un lato identificazione tempestiva e visibilità approfondita delle catene infrastrutturali digitali; dall’altro la capacità di gestire l’osservabilità non solo dei singoli componenti, ma della “salute” complessiva dell’Internet come sistema. Rob Newell lo ha messo in termini semplici: “Internet si sta rompendo”, e la domanda è “chi lo ripara”. Le analogie appropriate con la manutenzione di una città: “Se le strade crollano, non basta riparare un tombino; bisogna capire l’intera rete fognaria, il carico del sistema e la pressione che viene dal traffico”. In sintesi, non bastano strumenti reattivi, serve una visione sistemica.
Le infrastrutture digitali, i servizi cloud, le piattaforme web e gli strumenti AI che utilizzi non vivono in un vuoto funzionale: dipendono da componenti esterni, dalla rete, da provider terzi, da interazioni che a volte sfuggono al controllo diretto. E quando un guasto arriva, può avere impatti sulla logistica, sugli ordini, sulla customer-experience, sui pagamenti, e in ultima istanza sul fatturato. New Relic in sostanza suggerisce che il “rimedio” deve essere pensato come parte della strategia di progettazione — non solo “cosa faccio quando va male”, ma “come prevengo che vada male”.
Va aggiunto che la questione assume una dimensione anche geopolitica e infrastrutturale: nei mercati emergenti (come l’India citata nell’articolo) le perdite per interruzioni sono enormi in proporzione, e la dipendenza da provider globali può rappresentare un punto di vulnerabilità. L’articolo non lo esplora nel dettaglio, ma il riferimento è implicito. Per te, che risiedi in Italia e osservi anche scenari europei, vale la pena interrogarsi su come la resilienza digitale, l’autonomia tecnologica, la ridondanza dei sistemi e la preparazione agli scenari “worst case” – interruzioni, attacchi, congestioni – facciano parte della roadmap strategica.
