Recentemente, una nuova ipotesi ha suscitato l’attenzione della comunità scientifica: i grandi modelli di linguaggio (LLM) possono aiutare a creare buone teorie della cognizione umana. Questo approccio di teorizzazione basato sull’ingegneria, che applica i principi dell’ingegneria per valutare la praticità delle teorie consolidate nel campo delle scienze umane come la linguistica, la moralità e la psicologia, è un’idea importante che merita ulteriori esplorazioni.
Steven Piantadosi, professore alla UC Berkeley, sostiene che i sintattici generativi come Noam Chomsky si sono isolati dall’ingegneria, dai test empirici e dai confronti formali. I modelli linguistici moderni, invece, integrano diversi approcci computazionali al linguaggio attraverso principi architettonici incorporati, consentendo loro di emergere piuttosto che essere codificati direttamente. Questi modelli sono in grado di svolgere una varietà di funzioni diverse, come la capacità di fare previsioni di parole nel contesto e di mantenere la grammatica e il significato della frase anche durante la previsione della parola successiva.
Secondo Piantadosi, l’adattamento dei parametri nei modelli statistici come i LLM potrebbe anche portare alla costruzione della teoria del linguaggio. Il motivo per cui questi modelli sono in grado di farlo è che hanno strutture interne – come gli stati rappresentativi interni e i modelli attenzionali – che sono in grado di scomporre le frasi in parti costituenti in un albero-come struttura, con sorprendenti somiglianze con gli alberi di analisi annotati dall’uomo.
Tuttavia, ci sono anche critiche nei confronti di questo approccio di teorizzazione basato sull’ingegneria. Alcuni studiosi sostengono che i LLM restano dei “pappagalli stocastici”, ovvero modelli che imitano alcune regolarità nei dati senza comprendere il mondo in modo affidabile. Inoltre, alcuni studiosi ritengono che i LLM siano teorie molto povere della cognizione linguistica umana.
L’idea che i LLM possano insegnarci su come pensano gli esseri umani sembra controintuitiva, ma merita ulteriori esplorazioni. L’uso di questi modelli potrebbe portare a nuove scoperte e teorie nella linguistica e in altre scienze umane. Tuttavia, è importante riconoscere le limitazioni dei modelli attuali e continuare a esplorare nuove strade per la comprensione della cognizione umana.
In effetti, la ricerca sulle LLM ha dimostrato che questi modelli possono fare molto di più che semplicemente imitare regolarità nei dati. I modelli di linguaggio di grandi dimensioni hanno ottenuto notevoli successi nello scoprire la grammatica senza utilizzare i metodi che alcuni in linguistica insistevano fossero necessari per il progresso di una scienza del linguaggio. Questo implica che questi modelli possono aiutare a creare buone teorie della cognizione umana.
Inoltre, è interessante notare come i grandi modelli linguistici siano in grado di sviluppare la rappresentazione delle strutture chiave e delle relazioni all’interno del linguaggio, in modo simile a come lo fanno gli esseri umani. Ciò suggerisce che, sebbene i LLM non siano in grado di ragionare come gli esseri umani, possono comunque fornire un’ottima base per lo sviluppo di teorie sulla cognizione umana.
Tuttavia, come sottolineato dai critici, i modelli attuali hanno ancora molte limitazioni e non possono ancora essere considerati teorie complete della cognizione umana. Allo stesso tempo, è importante sottolineare che i grandi modelli linguistici non devono essere visti come una minaccia alla ricerca tradizionale sulla cognizione umana, ma piuttosto come una nuova risorsa per esplorare nuove strade nella comprensione della mente umana.
In definitiva, la discussione su come i grandi modelli linguistici possano contribuire alla creazione di teorie sulla cognizione umana è ancora in corso. Molti studiosi vedono queste macchine come un’importante risorsa per la ricerca futura, ma altri sottolineano le loro limitazioni attuali. Tuttavia, è chiaro che questi modelli rappresentano un’importante evoluzione nel campo dell’IA e della linguistica, e continueranno a essere un argomento di grande interesse per gli studiosi di entrambi i campi.