Un recente studio condotto da ricercatori della New York University ha introdotto un modello di intelligenza artificiale (AI) ispirato al processo di apprendimento linguistico dei bambini. Per realizzarlo, hanno osservato bambini tra i 6 e i 25 mesi, utilizzando telecamere e microfoni per registrare il loro ambiente. Hanno scoperto che per apprendere una lingua non sono necessari tanti dati quanto quelli usati da un tipico modello di linguaggio di grandi dimensioni.
La rivista Science ha riportato che il modello, denominato “Child’s View for Contrastive Learning (CVCL)”, utilizza 61 ore di video e audio registrati dal punto di vista di un bambino di nome Sam nel periodo 2013-2014, combinando immagini e parole.
Si è osservato che la maggior parte dei bambini conosce circa 300 parole entro i due anni e oltre 1.000 parole entro i quattro anni. Nonostante la capacità umana di acquisire parole sia ancora poco compresa, questo esperimento ha dimostrato che l’apprendimento delle parole da dati minimi è più semplice di quanto si pensasse e non richiede presupposti pre-programmati.
Wei Kinh Fong, ricercatore di cognizione computazionale presso la NYU e autore principale dello studio, ha evidenziato la similitudine tra l’apprendimento delle macchine e quello umano, sottolineando che gli esseri umani operano con meno informazioni. Brandon Lake, professore associato di psicologia e scienza dei dati alla NYU, ha aggiunto che i modelli attuali non necessitano di grandi quantità di input per fare generalizzazioni significative.
Il modello AI sviluppato dai ricercatori è multimodale, combinando un codificatore di visione e uno di testo per analizzare ciò che Sam vedeva e diceva. Nonostante le difficoltà nel distinguere il discorso di Sam da altri suoni ambientali, il modello è riuscito a correlare accuratamente le parole ai video.
Il modello ha mostrato una precisione del 62% nel riconoscere oggetti specifici in un test a scelta multipla e ha dimostrato la capacità di “generalizzazione a colpo zero”, identificando oggetti non presenti nei video. Questo risultato ha sorpreso i ricercatori.
Jessica Sullivan, professoressa associata di psicologia allo Skidmore College, ha riconosciuto l’importanza di questo studio, che ha sfidato la teoria internalista secondo la quale gli esseri umani nascono con la capacità innata di parlare.
Nonostante i progressi, lo studio ha dei limiti. I ricercatori non hanno esplorato altri fattori che influenzano l’apprendimento linguistico nei bambini e il modello era limitato nel riconoscere solo nomi di oggetti fisici, non verbi o concetti astratti.
Eva Fortrans, ricercatrice di linguistica computazionale presso il Millar-Quebec AI Institute, ha sottolineato il potenziale della ricerca AI nel contribuire alla comprensione della mente umana e all’educazione, oltre che alle applicazioni commerciali.