Google DeepMind ha recentemente rilasciato i modelli Gemini 2.5 Pro e Gemini 2.5 Flash, utilizzando il gioco Pokémon come banco di prova per valutare le capacità decisionali delle intelligenze artificiali. Durante queste sessioni, è emerso un comportamento inaspettato: quando i Pokémon virtuali rischiavano di essere sconfitti, l’IA mostrava segni di “panico”, manifestando un evidente deterioramento nelle sue capacità di inferenza.
Questo fenomeno, definito “panico dell’agente”, si traduceva in decisioni affrettate e inadeguate, come l’abbandono improvviso di strumenti utili o l’adozione di strategie inefficaci. Sebbene l’IA non provi emozioni, questo comportamento imita le reazioni umane sotto stress, evidenziando le sfide nell’addestramento di modelli che operano in ambienti complessi e dinamici.
Per osservare questi esperimenti, è possibile seguire i canali Twitch “Gemini Plays Pokémon” e “Claude Plays Pokémon”, dove l’IA gioca in tempo reale, fornendo uno spunto interessante per comprendere le sue modalità decisionali.
Nonostante queste difficoltà, Gemini 2.5 Pro ha dimostrato anche capacità avanzate, come la risoluzione autonoma di enigmi complessi nel gioco, suggerendo un potenziale significativo per applicazioni future in scenari reali.