Nel vasto universo dell’intelligenza artificiale (IA), spesso si tende a immaginare queste tecnologie come strumenti onnipotenti, capaci di risolvere problemi complessi con facilità impressionante. Tuttavia, a volte sono proprio i confronti più inaspettati a rivelare i limiti attuali di queste macchine sofisticate. Un esempio emblematico è arrivato di recente con GPT-4o, l’ultimo modello di IA sviluppato da OpenAI, che si è trovato incapace di superare un gioco di scacchi rudimentale degli anni ’70: Atari Chess, un titolo risalente al 1979.
L’esperimento è stato condiviso da Robert Jr. Caruso, esperto americano nel campo dell’architettura Citrix, che ha deciso di mettere alla prova la capacità di ragionamento e strategia di GPT-4o contro Atari Chess, emulato su una vecchia console Atari 2600, un dispositivo che per gli standard odierni rappresenta una tecnologia quasi primitiva. La console, alimentata da un processore MOS 6507 con una frequenza di appena 1,19 MHz, poteva effettuare calcoli estremamente limitati: parliamo di migliaia di operazioni in virgola mobile al secondo (KFLOPS), una quantità microscopica rispetto alle capacità di calcolo moderne, che si misurano in miliardi di operazioni al secondo (GFLOPS).
Questa limitazione hardware si traduceva in un motore scacchistico che poteva prevedere solo una o due mosse in anticipo, molto lontano dall’approccio approfondito e potente degli attuali motori di scacchi basati su IA. Eppure, nonostante queste evidenti limitazioni, Atari Chess è riuscito a mettere in difficoltà GPT-4o, dimostrando che la potenza di calcolo e la sofisticazione generale non sono sempre sufficienti per superare sfide apparentemente semplici.
Caruso ha riportato come GPT-4o abbia commesso errori grossolani già all’inizio del gioco, giustificandosi con ragionamenti confusi e riferimenti a icone astratte che nulla avevano a che fare con la strategia scacchistica. Anche quando il design del gioco è stato semplificato per facilitare la comprensione del modello, l’IA ha continuato a compiere mosse errate, mostrando una difficoltà evidente nel ragionamento diretto e nell’applicazione corretta delle regole di un gioco strutturato.
“Questo è un livello che farebbe ridere anche in un club di scacchi di terza elementare”, ha commentato con ironia Caruso, sottolineando come l’IA più avanzata oggi fatichi persino a competere con algoritmi basici di decenni fa, nel contesto di un gioco dalle regole fisse e ben definite.
Alla fine, nonostante i tentativi di migliorare la propria strategia, GPT-4o ha ammesso la sconfitta, confermando che in certi contesti la capacità di ragionamento contestuale e la comprensione profonda delle regole sono essenziali e non possono essere completamente compensate da una semplice potenza di calcolo o da capacità di elaborazione linguistica di alto livello.
Questo episodio getta luce su un aspetto cruciale del progresso dell’intelligenza artificiale: nonostante i modelli come GPT-4o abbiano rivoluzionato la capacità di comprendere e generare linguaggio naturale, la loro efficacia in compiti che richiedono ragionamento logico strutturato e pianificazione a lungo termine può ancora essere limitata.
Storicamente, gli scacchi sono stati una delle prime sfide affrontate dall’IA. Nel 1997, il supercomputer Deep Blue di IBM ha sconfitto il campione mondiale Garry Kasparov, calcolando oltre 200 milioni di mosse al secondo e dimostrando la supremazia delle macchine in un dominio così complesso. Tuttavia, mentre i motori scacchistici specializzati continuano a migliorare attraverso algoritmi dedicati e ottimizzati, le intelligenze artificiali di uso generale come GPT-4o, nate per comprendere il linguaggio e affrontare problemi diversi, non sempre eccellono in compiti specialistici.
L’esperimento di Caruso ci ricorda dunque che l’intelligenza artificiale non è un’entità monolitica e onnipotente, ma un insieme di strumenti con punti di forza e debolezze differenti. La capacità di elaborare enormi quantità di dati linguistici con naturalezza umana non garantisce automaticamente competenze avanzate di ragionamento strategico o applicazione rigorosa delle regole di un gioco.