OpenAI, l’azienda leader nel campo dell’intelligenza artificiale, sta affrontando significativi ritardi nello sviluppo del suo modello di punta di nuova generazione, noto come “GPT-5” o “Orion”. Nonostante oltre 18 mesi di lavoro dedicato, i risultati ottenuti non hanno soddisfatto le aspettative iniziali.

Secondo un articolo del Wall Street Journal del 20 dicembre 2024, che cita fonti interne anonime, OpenAI ha incontrato numerosi ostacoli nel progetto Orion, causando continui rinvii nel rilascio del modello. Nonostante gli sforzi, GPT-5 non ha mostrato miglioramenti di performance tali da giustificare un avanzamento significativo rispetto al suo predecessore, GPT-4. La decisione di denominare un modello come GPT-5 si basa spesso su valutazioni soggettive e sul consenso tra gli ingegneri; attualmente, il clima interno non sembra favorevole a tale denominazione.

Un aspetto rilevante emerso è che OpenAI ha ripetuto il pre-training del modello almeno due volte, con ciascuna sessione della durata di circa sei mesi e un costo stimato di 500 milioni di dollari, per un totale di circa un miliardo di dollari. Nonostante l’investimento, i progressi ottenuti sono stati inferiori alle aspettative. Questo rallentamento ha alimentato preoccupazioni riguardo a una possibile fase di stallo nello sviluppo dell’intelligenza artificiale.

Per affrontare queste sfide, OpenAI ha adottato diverse strategie. Ha stipulato accordi con oltre 20 grandi media globali per ottenere dati di alta qualità e ha assunto personale specializzato nella creazione di nuovi dataset attraverso la scrittura di codice e la risoluzione di problemi matematici. Inoltre, ha utilizzato dati sintetici prodotti internamente. Nonostante questi sforzi, i risultati del pre-training non sono stati soddisfacenti.

Un’altra questione critica riguarda l’infrastruttura di supercalcolo. Fonti interne suggeriscono che OpenAI potrebbe non disporre di risorse sufficienti per supportare adeguatamente il training dei modelli. Per ovviare a questo, l’azienda ha avviato collaborazioni con startup come Crusoe e Oracle per costruire uno dei più grandi data center al mondo, dotato di 50.000 unità del modello “Blackwell” di NVIDIA. Inoltre, ha stretto partnership con Broadcom e TSMC per sviluppare chip AI proprietari. Tuttavia, anche con queste iniziative, la ripetizione del pre-training richiederebbe almeno sei mesi. Il nuovo data center in costruzione in Texas dovrebbe essere completato nella prima metà del 2025.

Al momento, non è chiaro se OpenAI deciderà di intraprendere un ulteriore ciclo di pre-training, con i relativi costi e tempi, o se si concentrerà sul miglioramento del modello attuale attraverso tecniche di post-training, per poi procedere al rilascio. L’azienda ha rifiutato di commentare queste informazioni. In precedenza, aveva dichiarato di non avere in programma il rilascio di Orion o GPT-5 entro la fine del 2024.

Parallelamente, anche Google ha affrontato sfide simili nello sviluppo dei suoi modelli AI. Nonostante ciò, l’11 dicembre 2024 ha lanciato “Gemini 2.0”, focalizzandosi su un modello ottimizzato per agenti AI, senza dichiarare di aver raggiunto l’intelligenza artificiale generale (AGI). OpenAI, dal canto suo, prevede di annunciare un proprio agente AI, denominato “Operator”, nel gennaio 2025.

Di Fantasy