Dal momento in cui OpenAI ha introdotto ChatGPT alla fine del 2022, i grandi modelli linguistici (LLM) hanno assunto un ruolo sempre più rilevante nell’intelligenza artificiale (AI), specialmente nel campo dell’elaborazione del linguaggio naturale (NLP). Questi LLM, progettati per elaborare e produrre testo simile a quello umano, imparano da una vasta gamma di fonti online, inclusi libri e siti web. Questo metodo di apprendimento consente loro di catturare l’essenza del linguaggio umano, rendendoli capaci di affrontare una vasta gamma di problemi.
Nonostante il progresso nell’uso degli LLM, il processo di adattamento di questi modelli per specifiche applicazioni, noto come “fine tuning”, presenta delle sfide. Il tuning richiede ulteriori addestramenti su insiemi di dati più specifici, il che può essere problematico a causa della necessità di dati etichettati, del rischio di perdita di precisione del modello e del consumo di risorse considerevoli.
Per superare queste sfide, i ricercatori di Google hanno introdotto di recente il concetto di “social learning” nell’intelligenza artificiale, ispirato al modo in cui gli esseri umani imparano osservando gli altri. Quando gli LLM vengono trasformati in chatbot, sono in grado di interagire e apprendere gli uni dagli altri, simile al processo di apprendimento sociale umano. Questa interazione migliora le loro capacità e l’efficacia complessiva.
L’apprendimento sociale non è una novità, ma si basa su una teoria di Albert Bandura degli anni ’70, che sostiene che le persone imparino osservando gli altri. Applicato all’intelligenza artificiale, questo significa che i sistemi possono migliorare interagendo tra loro, imparando non solo dall’esperienza diretta, ma anche dall’osservazione delle azioni degli altri. Questo metodo promette una rapida acquisizione di competenze e potrebbe persino consentire agli LLM di sviluppare una sorta di “cultura” condivisa.
A differenza di altri approcci di apprendimento dell’intelligenza artificiale, come l’apprendimento per rinforzo o l’apprendimento per imitazione, l’apprendimento sociale si concentra sull’interazione tra i modelli. Questo metodo offre un modo pratico e collaborativo per far sì che l’intelligenza artificiale acquisisca nuove competenze.
Un aspetto chiave dell’apprendimento sociale è la condivisione di conoscenze senza rivelare informazioni sensibili. Per far ciò, i ricercatori hanno adottato una dinamica insegnante-studente, dove i modelli insegnanti facilitano l’apprendimento dei modelli studenti senza rivelare dati riservati. Ad esempio, se un modello è addestrato per distinguere tra messaggi di testo spam e non spam, può insegnare a un altro modello senza rivelare dati sensibili. Questo approccio non solo migliora l’efficienza dell’apprendimento, ma dimostra anche il potenziale degli LLM di apprendere in modo dinamico e adattabile, creando una sorta di “cultura” condivisa.
L’apprendimento sociale affronta diverse sfide nell’adattamento dei LLM:
- Riduzione della dipendenza dai dati etichettati.
- Evitare la specializzazione eccessiva.
- Ridurre l’overfitting.
- Utilizzare in modo efficiente le risorse.
Il potenziale dell’apprendimento sociale negli LLM suggerisce molteplici direzioni per la ricerca futura sull’intelligenza artificiale, tra cui l’esplorazione di “culture” condivise, l’apprendimento multimodale, la decentralizzazione dell’apprendimento, l’interazione uomo-intelligenza artificiale, lo sviluppo etico dell’intelligenza artificiale, i sistemi di auto-miglioramento e la privacy nell’apprendimento. Questo approccio segna un passo significativo verso sistemi di intelligenza artificiale più collaborativi, versatili ed etici, che possono rivoluzionare il campo della ricerca e dell’applicazione dell’intelligenza artificiale.