Ci sono indizi che suggeriscono che “GPT-4” potrebbe non essere stato creato a San Francisco, negli Stati Uniti, come ci si potrebbe aspettare dalla sede principale di OpenAI, ma piuttosto in un remoto campo di grano nell’Iowa occidentale. Questa affermazione è emersa per la prima volta durante un discorso di un alto dirigente di Microsoft (MS) e sembra essere collegata alla notevole quantità di acqua necessaria per alimentare il processo di addestramento dei modelli linguistici su larga scala (LLM).
Secondo quanto riportato, un dirigente di Microsoft avrebbe dichiarato: “È stato letteralmente realizzato vicino a un campo di grano a ovest di Des Moines”. Des Moines, una città con una popolazione di 68.000 abitanti, ospita un data center di Microsoft da oltre un decennio, e si prevede l’apertura di ulteriori centri dati entro la fine dell’anno.
L’Iowa è una regione agricola emblematica degli Stati Uniti, con oltre il 75% del suo territorio coperto da campi di mais e soia. È interessante notare l’ironia del fatto che un luogo così rurale abbia dato vita a un avanzato modello di intelligenza artificiale (IA), simboleggiando il contrasto tra la tecnologia all’avanguardia e l’immagine tradizionale della regione.
Si è affermato che il data center responsabile dell’addestramento di GPT-4 abbia utilizzato l’acqua proveniente dai fiumi Raccoon e Des Moines, situati nel cuore dell’Iowa centrale, per raffreddare i suoi supercomputer. Questa scelta sarebbe stata determinata da problemi relativi all’approvvigionamento idrico, nonostante inizialmente fossero state considerate altre località.
È noto che l’addestramento dei supercomputer durante il processo LLM richieda considerevoli quantità di acqua. Ad esempio, Google ha recentemente reso noto che i suoi data center hanno consumato 5,2 miliardi di litri d’acqua nell’anno precedente, registrando un aumento del 20% rispetto all’anno precedente. Questa quantità d’acqua sarebbe sufficiente a soddisfare le esigenze idriche di un milione di adulti per un mese, considerando un consumo giornaliero di 2 litri a persona.
Anche Meta ha dichiarato che i suoi data center hanno utilizzato 1,33 miliardi di litri d’acqua nel 2021, evidenziando l’impatto ambientale del funzionamento dei grandi centri di elaborazione dati.
Inoltre, studi recenti hanno rivelato che per addestrare modelli come “GPT-3” sono stati utilizzati fino a 700.000 litri d’acqua, dimostrando l’enorme consumo di risorse necessario per l’IA su larga scala. In risposta a queste preoccupazioni, OpenAI ha annunciato ufficialmente il suo impegno a migliorare l’efficienza energetica e idrica nel processo di apprendimento LLM, riconoscendo l’importanza di affrontare questa sfida ambientale.