Ricercatori del Georgia Institute of Technology hanno sviluppato PokéLLMon, un innovativo agente integrato in un Large Language Model (LLM), che ha mostrato prestazioni pari a quelle umane nei giochi di battaglia tattici, con risultati evidenti nelle competizioni Pokémon.
Le prestazioni eccezionali di PokéLLMon sono il risultato dell’implementazione di tre strategie fondamentali:
- Apprendimento rinforzato in contesto: l’agente sfrutta feedback testuali immediati durante le battaglie, utilizzando l’apprendimento rinforzato per migliorare progressivamente la sua strategia di gioco.
- Generazione potenziata dalla conoscenza: PokéLLMon integra informazioni esterne per evitare errori di giudizio, permettendo all’agente di prendere decisioni rapide e basate su dati concreti.
- Produzione di azioni coerenti: per affrontare avversari formidabili senza perdere la calma, l’agente utilizza tattiche di azione coerenti e ben ponderate.
Competendo online contro avversari umani, PokéLLMon ha dimostrato di adottare strategie di battaglia umane e di prendere decisioni in tempo reale. Ha raggiunto una percentuale di vittorie del 49% in competizioni Ladder e un impressionante 56% in battaglie su invito.
L’uso di agenti LLM si sta rivelando efficace anche in giochi a mondo aperto, come dimostrato da Generative Agent e Voyager in MineCraft, che esibiscono comportamenti e interazioni sociali simili a quelli umani.
I giochi di battaglia tattici sono ideali per testare le capacità di gioco degli LLM, grazie a risultati di vittoria misurabili e la presenza costante di avversari. A differenza di applicazioni precedenti in giochi come StarCraft II, PokéLLMon ha il vantaggio di tradurre fedelmente gli stati di battaglia Pokémon in testo, offrendo un formato a turni che riduce la pressione del tempo reale e presenta la sfida aggiuntiva di competere contro giocatori umani ben preparati.