Il sogno di scalare senza limiti l’infrastruttura cloud, cavalcando l’onda dell’intelligenza artificiale, si scontra oggi con una realtà più concreta e problematica: i data center non bastano. Secondo quanto riferito da Bloomberg e dai media specializzati, Microsoft si troverebbe in difficoltà a soddisfare la domanda del suo servizio Azure, tanto che in alcune regioni degli Stati Uniti ha deciso di limitare l’iscrizione di nuovi clienti — una misura che, fino a poco tempo fa, sembrava impensabile per un colosso del cloud.
A spingere questa decisione è la pressione evocata da OpenAI, che ha richiamato un’enorme quantità di risorse computazionali: il fenomeno ChatGPT non è più un’incursione, ma un’onda continua che richiede GPU, circuiti, energia, spazio fisico. Microsoft ha fatto sapere di aver aggiunto 2 gigawatt di capacità nei data center nell’ultimo anno — una cifra impressionante, paragonabile alla potenza di una diga — ma nemmeno questo sembra bastare. In particolare, le regioni della Virginia e del Texas, già nodi critici per Azure, sarebbero quelle soggette ai vincoli maggiori: nuove registrazioni Azure sarebbero soggette a limitazioni almeno fino alla prima metà del 2026.
Questa prospettiva supera di gran lunga le attese precedenti: fino a qualche mese fa, Microsoft stimava che le sue limitazioni di capacità si sarebbero attenuate entro la fine del 2025. Ora, invece, fonti interne suggeriscono che il “collo di bottiglia” persisterà ben oltre quella scadenza. A testimonianza della gravità della situazione è l’ammissione del CTO Kevin Scott: qualunque piano, anche il più aggressivo, non riuscirà a soddisfare la domanda generata da ChatGPT e GPT-4.
Il fenomeno non riguarda soltanto i carichi di lavoro “nuovi” per l’IA: le normali richieste di CPU, le operazioni di back-office, i servizi Office 365 e molte applicazioni aziendali stanno anch’essi contribuendo a saturare la capacità disponibile. Le fonti rivelano che in alcuni casi è stato chiesto ai team interni di Microsoft di “mettere in pausa” progetti non prioritari, per liberare risorse dove più necessario.
Sul fronte delle comunicazioni aziendali, Microsoft cerca di tranquillizzare: i clienti già esistenti potranno continuare ad ampliare i propri carichi di lavoro, mentre per i nuovi arriva una “politica di conservazione della capacità” — un modo elegante per dire che le risorse verranno distribuite e allocate con maggior cautela. E se una regione è sovraccarica, agli utenti verrebbe proposto di spostarsi in aree meno congestionate. Ma questa “migrazione geografica” può generare latenza, costi aggiuntivi e complessità operative non trascurabili.
Quali conseguenze per chi investe oggi nel cloud? Molte aziende, specialmente quelle sensibili al tempo di latenza o ai vincoli di compliance geografica, starebbero già valutando di spostarsi su altri fornitori cloud o di adottare strategie ibride: tenere carichi critici nei data center personali, utilizzare Azure solo per parti non sensibili, affiancare back-up su AWS o Google Cloud.