Il panorama delle applicazioni basate su modelli linguistici di grandi dimensioni (LLM) è in costante evoluzione, passando dai semplici prompt alla più avanzata generazione aumentata di recupero (RAG) e agli agenti. Negli ambienti industriali e di ricerca, si sta discutendo ampiamente degli agenti, principalmente per il loro potenziale nel trasformare le applicazioni aziendali e migliorare l’esperienza del cliente. Questi agenti rappresentano un passo significativo verso l’intelligenza artificiale generale (AGI).
In un mio articolo precedente, abbiamo esplorato una scala di modelli intelligenti utilizzati per creare applicazioni basate su LLM. Abbiamo iniziato con prompt che acquisiscono la conoscenza interna di un dominio e la utilizzano per generare risultati. Con RAG, abbiamo ampliato il prompt incorporando la conoscenza esterna da un database vettoriale per guidare la generazione di output. Successivamente, abbiamo concatenato le chiamate a LLM per creare flussi di lavoro complessi. Gli agenti portano questa evoluzione al livello successivo, determinando automaticamente come formare catene di chiamate LLM. Vediamo tutto ciò in dettaglio.
Ciò che rende gli agenti speciali è la loro capacità di sfruttare il potere della comprensione del linguaggio di LLM per elaborare un piano per risolvere problemi specifici. L’LLM comprende il problema e fornisce una sequenza di passi per risolverlo. Tuttavia, gli agenti non si limitano a consigliare una soluzione; hanno anche la capacità di eseguire azioni specifiche.
Immagina di porre una domanda semplice a un agente:
Umano: Quale azienda ha fondato l’inventore del telefono?
Ecco come un agente potrebbe elaborare la risposta:
Agente (PENSANDO):
- Pensiero: Devo cercare l’inventore del telefono.
- Azione: Cerca [inventore del telefono].
- Osservazione: Alexander Graham Bell.
- Pensiero: Devo cercare un’azienda fondata da Alexander Graham Bell.
- Azione: Cerca [azienda fondata da Alexander Graham Bell].
- Osservazione: Alexander Graham Bell ha co-fondato l’American Telephone and Telegraph Company (AT&T) nel 1885.
- Pensiero: Ho trovato la risposta. Ritornerò. Agente (RISPOSTA): Alexander Graham Bell ha co-fondato AT&T nel 1885.
Come puoi vedere, l’agente suddivide il problema in passi più piccoli e prende azioni specifiche, tutte guidate dall’LLM. Queste azioni possono essere associate a strumenti specifici per l’implementazione pratica. Ad esempio, uno strumento di ricerca potrebbe essere attivato dall’agente per effettuare una ricerca su Internet o in una base di conoscenza interna.
Con l’avanzare della complessità degli agenti, le azioni possono essere collegate a strumenti che apportano modifiche nei sistemi di origine. Ad esempio, un agente potrebbe controllare il saldo ferie e richiedere le ferie in un sistema ERP per un dipendente. Questo consente la creazione di chatbot interattivi che semplificano processi aziendali complessi.
Tuttavia, è importante notare che, a causa delle dimensioni dei modelli LLM, gli agenti possono occasionalmente comportarsi in modo imprevedibile, rendendo fondamentale l’adozione di principi di intelligenza artificiale responsabile. Questi principi si concentrano sulla trasparenza, la riproducibilità e la responsabilità nell’ambito delle decisioni prese dagli agenti, assicurando che le azioni compiute siano ben ponderate e controllate.
Gli agenti stanno aprendo nuove possibilità nell’intelligenza artificiale, avvicinando sempre di più i computer al ragionamento umano. Con strumenti più potenti, questi agenti possono acquisire “superpoteri” e diventare una risorsa preziosa in vari contesti e settori. Tuttavia, la cautela è necessaria per garantire che l’intelligenza artificiale responsabile guidi il loro sviluppo e l’uso, evitando scenari da film di fantascienza.