I ricercatori di Google DeepMind hanno presentato Talker-Reasoner, un framework innovativo per agenti di intelligenza artificiale che si ispira al modello dei “due sistemi” della cognizione umana. Questo framework è progettato per consentire agli agenti AI di gestire in modo efficace attività che richiedono sia velocità che capacità di ragionamento complesso.
La teoria dei due sistemi, proposta dal premio Nobel Daniel Kahneman, suggerisce che il pensiero umano sia governato da due modalità distinte. Il Sistema 1 è veloce, intuitivo e automatico, ideale per reazioni rapide e riconoscimento di schemi. Al contrario, il Sistema 2 è lento, deliberato e analitico, adatto per la risoluzione di problemi complessi e pianificazione.
Sebbene spesso vengano considerati separati, questi due sistemi interagiscono continuamente. Il Sistema 1 genera impressioni e intuizioni, mentre il Sistema 2 le valuta e integra in decisioni consapevoli. Gli attuali agenti di intelligenza artificiale operano principalmente in modalità Sistema 1, eccellendo in compiti ripetitivi e nel riconoscimento di pattern, ma spesso mancano delle capacità di pianificazione e ragionamento del Sistema 2.
Il framework Talker-Reasoner di DeepMind mira a dotare gli agenti AI di capacità di entrambi i sistemi. Esso è composto da due moduli principali: Talker e Reasoner.
Talker: Funziona come il Sistema 1, gestendo interazioni in tempo reale con l’utente. Il Talker percepisce osservazioni, interpreta il linguaggio, recupera informazioni dalla memoria e genera risposte conversazionali. Utilizza le capacità di apprendimento contestuale dei modelli linguistici di grandi dimensioni (LLM).
Reasoner: Rappresenta il Sistema 2, dedicato a compiti di ragionamento e pianificazione complessi. Interagisce con strumenti e fonti di dati esterne, aggiornando le convinzioni dell’agente in base alle nuove informazioni raccolte, che poi il Talker utilizza nelle sue interazioni.
I due moduli comunicano attraverso un sistema di memoria condivisa. Il Reasoner aggiorna la memoria con le sue conclusioni, mentre il Talker le utilizza per mantenere un flusso conversazionale continuo, anche mentre il Reasoner esegue i suoi calcoli in background.
I ricercatori hanno testato il framework in un’applicazione di coaching del sonno, dove un coach AI interagisce con gli utenti attraverso il linguaggio naturale, offrendo supporto personalizzato per migliorare le abitudini del sonno. Qui, il Talker fornisce risposte empatiche, mentre il Reasoner mantiene uno stato di convinzione sulle esigenze e obiettivi dell’utente, generando raccomandazioni personalizzate.
Questa struttura potrebbe essere applicata anche in altri ambiti, come il servizio clienti o l’istruzione personalizzata.
I ricercatori di DeepMind hanno delineato diverse aree per la ricerca futura. Un obiettivo è ottimizzare l’interazione tra Talker e Reasoner, affinché il Talker riconosca automaticamente quando è necessario l’intervento del Reasoner. Inoltre, si prevede di espandere il framework per includere più Reasoner specializzati in vari tipi di ragionamento o domini, migliorando la capacità dell’agente di affrontare compiti complessi e fornire assistenza più completa.