Dopo un periodo di relativa quiete post-lancio di Google Gemini 3, OpenAI è tornata sulla scena con una serie di dichiarazioni dirette e il rilascio inatteso, sebbene pianificato, del suo nuovo modello linguistico di punta, GPT-5.2. L’azienda ha cercato di riaffermare la propria posizione di leadership nel settore, smorzando al contempo le percezioni di panico interno generate dalla concorrenza di Google.
Il CEO di OpenAI, Sam Altman, ha fornito un primo commento pubblico sull’impatto del rivale di Google, minimizzando la portata della minaccia. In un’intervista, Altman ha affermato che “Gemini 3 ha avuto un impatto minore sui nostri parametri rispetto a quanto previsto”, un tono decisamente più misurato rispetto al precedente e conciso tweet di congratulazioni rivolto a Google per il lancio del suo modello. Questa dichiarazione arriva a fare chiarezza sull’effettiva efficacia di Gemini 3 e sulla presunta necessità di una reazione precipitosa da parte di OpenAI.
La tensione competitiva aveva precedentemente portato all’emissione interna di un “Codice Rosso”, un allarme competitivo di cui Altman ha parlato apertamente per la prima volta. Riconoscendo l’importanza di una reazione rapida di fronte a una minaccia competitiva, ha comunque specificato che si aspettano di revocare l’allerta di emergenza entro gennaio, consolidando una “posizione molto solida” per l’azienda. Fiji Simo, CEO di Applications, ha chiarito lo scopo del Codice Rosso, descrivendolo come un meccanismo per comunicare chiaramente all’azienda dove concentrare le risorse e stabilire priorità strategiche, non un segnale di crisi imminente o di sviluppo affrettato.
A dispetto delle voci di un rilascio anticipato, con un rapporto della scorsa settimana che suggeriva che GPT-5.2 fosse stato rilasciato prima del previsto ignorando le richieste di tempo extra per i test da parte degli sviluppatori, i dirigenti di OpenAI hanno respinto con fermezza l’idea di un rilascio affrettato per recuperare terreno. Max Schwarzer, a capo del team di formazione post-rilascio, ha sottolineato che il lancio di GPT-5.2 era stato pianificato “con mesi di anticipo”, smentendo ogni speculazione su una mossa dettata dal panico competitivo.
Nonostante le dichiarazioni di calma, le prestazioni di GPT-5.2 sono al centro dell’attenzione. Il nuovo modello ha dimostrato prestazioni di codifica superiori nel test SWE-Bench Verified, superando Gemini 3 Pro con un impressionante 80% contro il 76,2% del concorrente di Google, pur rimanendo leggermente dietro Anthropic Cloud Opus 4.5. Schwarzer ha tentato di minimizzare il leggero svantaggio, mettendo in discussione l’adeguatezza del benchmark stesso, affermando che il nuovo parametro di riferimento SWE-Bench Pro, ritenuto più esigente e diversificato, posiziona il nuovo modello di OpenAI in una posizione di superiorità complessiva rispetto ai rivali.
Oltre alla performance grezza, la conferenza stampa ha messo in luce i notevoli guadagni di efficienza del modello. È stato evidenziato come l’ultima iterazione, nonostante ottenga punteggi significativamente migliori in test come ARC-AGI, lo faccia richiedendo un costo computazionale e risorse quasi quattrocento volte inferiori rispetto a un modello rilasciato solo un anno fa. GPT-5.2 Pro High, ad esempio, ha raggiunto un’accuratezza del 90,5% a un costo di circa undici dollari per problema risolto, una cifra che rappresenta un miglioramento impressionante nell’efficienza operativa rispetto ai quattro mila cinquecento dollari richiesti da un modello precedente per un risultato inferiore.
Sul fronte delle funzionalità future, Simo ha annunciato che la tanto attesa “modalità per adulti” per la gestione di contenuti più espliciti è ora prevista per il lancio nel primo trimestre del prossimo anno, un lieve ritardo rispetto alla precedente previsione di Altman per dicembre. Il ritardo è attribuito alla necessità di perfezionare la tecnologia di previsione dell’età.
Infine, l’attenzione si è concentrata sulla capacità di generazione di immagini, un’area che ha alimentato la popolarità di modelli rivali. Simo ha confermato l’importanza della generazione di immagini come caso d’uso molto apprezzato, promettendo “altre novità in futuro” pur non avendo nulla di concreto da annunciare per il momento. Tuttavia, un criptico tweet di Altman, che prometteva “piccoli regali di Natale la prossima settimana”, ha riacceso l’attesa degli utenti che sperano in un rilascio, magari in tono minore, di funzionalità legate all’immagine, seguendo un’impronta meno formale rispetto all’evento “Shipmas” dello scorso anno.
