Il 12 agosto 2025, OpenAI ha annunciato con entusiasmo su X (precedentemente noto come Twitter) di aver vinto la medaglia d’oro alle Olimpiadi Internazionali di Informatica (IOI), una delle competizioni di programmazione più prestigiose al mondo. Questo trionfo segna un significativo passo avanti nell’evoluzione dell’intelligenza artificiale, dimostrando la capacità di modelli di uso generale di affrontare sfide complesse senza l’ausilio di strumenti esterni o accesso a Internet.
Nel 2024, OpenAI aveva partecipato all’IOI con il modello “o1-ioi”, ottenendo un punteggio di 213 punti, posizionandosi al 49° percentile tra i partecipanti umani. Tuttavia, nel 2025, l’azienda ha registrato un notevole miglioramento, raggiungendo un punteggio di 533,29 punti, classificandosi al sesto posto su 330 partecipanti umani e al primo posto tra gli intelligenze artificiali. Questo risultato è stato ottenuto utilizzando un sistema di inferenza di uso generale, senza alcuna ottimizzazione specifica per la competizione.
Alla base di questo successo c’è l’implementazione di una tecnica innovativa chiamata “verificatore universale”. Questa metodologia consente a un modello di intelligenza artificiale di valutare e correggere autonomamente le proprie risposte, migliorando così l’affidabilità e la precisione delle soluzioni proposte. Secondo quanto dichiarato da OpenAI, il verificatore universale è stato integrato nel modello GPT-5, previsto per il rilascio nei prossimi mesi.
L’IOI 2025 ha visto la partecipazione di 330 studenti provenienti da 84 paesi. La competizione si è svolta su due giorni, con tre problemi algoritmici complessi da risolvere ogni giorno, utilizzando il linguaggio di programmazione C++ e senza accesso a Internet o risorse esterne. I partecipanti avevano a disposizione cinque ore al giorno per completare le loro soluzioni, sottoposte a una valutazione automatica tramite test nascosti.
OpenAI ha partecipato ufficialmente alla sezione online dell’IOI, rispettando le stesse restrizioni imposte ai concorrenti umani, inclusi i limiti di tempo e il numero di tentativi consentiti. Il sistema di inferenza utilizzato ha generato 50 soluzioni di programmazione, selezionando quelle ottimali per la sottomissione, senza l’ausilio di tecniche di generazione aumentata o accesso a Internet.
Questo risultato evidenzia il potenziale dei modelli di intelligenza artificiale di uso generale nel risolvere problemi complessi in ambiti specifici, come la programmazione competitiva. L’integrazione del verificatore universale rappresenta un passo significativo verso lo sviluppo di sistemi di intelligenza artificiale più autonomi e affidabili, capaci di apprendere e adattarsi in tempo reale. Tuttavia, rimangono aperte questioni riguardanti la trasparenza e la replicabilità di tali risultati, aspetti fondamentali per l’affermazione di questi sistemi in contesti reali.