Il modello o3 di OpenAI ha trionfato nel Torneo di Scacchi AI organizzato da Kaggle, sconfiggendo Grok 4 di xAI con un netto 4-0 nella finale. Questa vittoria non solo ha segnato un successo tecnico, ma ha anche rappresentato un momento simbolico nella rivalità tra OpenAI e xAI, le due principali aziende fondate rispettivamente da Sam Altman ed Elon Musk.
Il torneo ha visto la partecipazione di otto modelli di linguaggio avanzati, tra cui Gemini 2.5 Pro di Google, Claude 4 Opus di Anthropic e DeepSeek R1. Ognuno di questi modelli ha dimostrato abilità straordinarie, ma è stato o3 a emergere come il più dominante. Dopo aver sconfitto Kimi K2 Instruct e o4-mini con punteggi identici, o3 ha affrontato Grok 4 in una finale che si è rivelata decisiva. Nonostante Grok 4 fosse considerato uno dei favoriti, ha commesso errori significativi, tra cui la perdita ripetuta della regina, che hanno compromesso le sue possibilità di vittoria.
La finale ha avuto anche una dimensione personale, dato che Altman e Musk, co-fondatori di OpenAI, hanno preso strade separate con la creazione di xAI. Musk ha commentato la sconfitta di Grok 4, definendo le sue prestazioni come un “effetto collaterale”, sottolineando che xAI non aveva dedicato risorse specifiche alla formazione per il gioco degli scacchi.
Questa vittoria evidenzia i progressi dei modelli di linguaggio generale nell’affrontare compiti complessi come gli scacchi, che tradizionalmente sono stati dominio di sistemi specializzati. Il successo di o3 suggerisce che l’IA sta evolvendo verso una maggiore capacità di ragionamento e strategia, con potenziali applicazioni in vari campi, dalla risoluzione di problemi complessi alla simulazione di scenari.
Il torneo ha anche messo in luce le differenze tra i modelli: mentre Grok 4 ha mostrato una certa vulnerabilità in situazioni di alta pressione, o3 ha mantenuto una performance costante e priva di errori. Questo potrebbe indicare che, sebbene Grok 4 eccella in compiti specifici, o3 offre una maggiore robustezza e adattabilità in scenari complessi.