L’uomo che ha inventato gli Assistenti virtuali pensa che siano condannati senza un nuovo approccio di intelligenza artificiale
Boris Katz ha trascorso la sua carriera cercando di aiutare le macchine a padroneggiare il linguaggio. Crede che le attuali tecniche di intelligenza artificiale non siano sufficienti per rendere Siri o Alexa veramente intelligenti.
Siri, Alexa, Google Home – la tecnologia che analizza il linguaggio trova sempre più spazio nella vita di tutti i giorni.
Boris Katz , uno dei principali ricercatori del MIT, non è molto colpito. Negli ultimi 40 anni, Katz ha dato un contributo fondamentale alle capacità linguistiche delle macchine. Negli anni ’80 ha sviluppato START , un sistema in grado di rispondere a quesiti formulati naturalmente. Le idee utilizzate in START hanno aiutato la vittoria di IBM su Watson su Jeopardy! e gettò le basi per i servi artificiali di oggi che chiacchieravano.
Ma Katz ora teme che il campo soffra di una dipendenza da idee vecchie di decenni, e che queste idee non ci daranno macchine dotate di vera intelligenza. L’ho incontrato per discutere gli attuali limiti degli assistenti AI e per sentire i suoi pensieri su dove la ricerca deve andare se mai diventeranno più intelligenti.
Come ti sei interessato a far usare il linguaggio ai computer?
Ho incontrato per la prima volta i computer negli anni ’60 come studente universitario all’Università di Mosca. Il particolare computer che ho usato era un mainframe chiamato BESM-4. Si poteva usare solo il codice ottale per comunicare con esso. Il mio primo progetto informatico consisteva nell’insegnare a un computer a leggere, capire e risolvere i problemi di matematica.
Poi ho sviluppato un programma per scrivere poesie. Ricordo ancora di essere in piedi nella sala macchine in attesa di vedere il prossimo poema generato dalla macchina. Ero sbalordito dalla bellezza delle poesie; sembravano prodotti da un’entità intelligente. E poi ho saputo che voglio lavorare per il resto della mia vita a creare macchine intelligenti e trovare modi per comunicare con loro.
Cosa ne pensi di Siri, Alexa e altri assistenti personali?
È divertente parlare di questo, perché da un lato siamo molto orgogliosi di questo incredibile progresso – tutti in tasca hanno qualcosa che abbiamo contribuito a creare qui tanti, tanti anni fa, che è meraviglioso.
Foto: MIT
Ma d’altra parte, questi programmi sono così incredibilmente stupidi. Quindi c’è la sensazione di essere orgogliosi e di essere quasi imbarazzati. Lanciate qualcosa che le persone sentono sia intelligente, ma non è nemmeno vicino.
Ci sono stati progressi significativi nell’IA grazie all’apprendimento automatico. Non è quello che rende le macchine migliori al linguaggio?
Da un lato c’è questo drammatico progresso, e poi alcuni di questi progressi sono gonfiati. Se guardi ai progressi dell’apprendimento automatico, tutte le idee arrivano da 20 a 25 anni fa . È solo che alla fine gli ingegneri hanno fatto un ottimo lavoro nel rendere queste idee una realtà. Questa tecnologia, per quanto grande, non risolverà il problema della vera comprensione – della vera intelligenza.
Sembra che stiamo facendo progressi nell’IA, anche se … (vedi ” 10 tecnologie innovative: assistenti personali che parlano senza intoppi “)?
A un livello molto alto, le tecniche moderne – tecniche statistiche come l’apprendimento automatico e l’apprendimento approfondito – sono ottime per trovare regolarità. E poiché gli umani di solito producono le stesse frasi per la maggior parte del tempo, è molto facile trovarli nella lingua.
Guarda il testo predittivo. La macchina conosce meglio di te quello che stai per dire. Potresti chiamarlo intelligente, ma è solo contare parole e numeri. Poiché continuiamo a dire la stessa cosa, è facile costruire sistemi che catturino le regolarità e agiscano come se fossero intelligenti. Questa è la natura fittizia di gran parte dei progressi attuali.
Che dire del “pericoloso” strumento di generazione della lingua annunciato recentemente da OpenAI ?
Questi esempi sono davvero impressionanti, ma non sono sicuro di cosa ci insegnino. Il modello linguistico OpenAI è stato addestrato su 8 milioni di pagine Web al fine di prevedere la parola successiva, date tutte le parole precedenti all’interno di un testo (che era sullo stesso argomento di quello su cui il modello è stato addestrato). Questa enorme quantità di formazione ha sicuramente assicurato la coerenza locale (sintattica e persino semantica) del testo.
Perché pensi che l’intelligenza artificiale sia diretta nel modo sbagliato nella lingua?
Nell’elaborazione del linguaggio, come in altri campi, sono stati fatti progressi formando modelli su enormi quantità di dati, molti milioni di frasi. Ma il cervello umano non sarebbe in grado di imparare la lingua usando questo paradigma. Non lasciamo i nostri bambini con un’enciclopedia nella culla, aspettandoci di padroneggiare la lingua.
Quando vediamo qualcosa, lo descriviamo nel linguaggio; quando sentiamo qualcuno parlare di qualcosa, immaginiamo come appaiono gli oggetti e gli eventi descritti nel mondo. Gli esseri umani vivono in un ambiente fisico, pieno di input sensoriali visivi, tattili e linguistici, e la natura ridondante e complementare di questi input rende possibile che i bambini umani abbiano un senso del mondo e imparino la lingua allo stesso tempo. Forse studiando queste modalità in isolamento, abbiamo reso il problema più difficile che semplice?
Perché è importante il buon senso?
Dire il tuo robot sta aiutando fare i bagagli, e ti dico che: “Questo libro non si adatterebbe nella casella di rosso perché esso è troppo piccolo. Chiaramente, vuoi che il tuo robot capisca che la redbox è troppo piccola, in modo che tu possa continuare ad avere una conversazione significativa. Tuttavia, se dite il robot: “Questo libro non sarebbe adatta nella casella di rosso perché esso è troppo grande”, si desidera che il robot per capire che il libro è troppo grande.
Sapere quale entità in una conversazione si riferisce a un pronome è un compito molto comune che gli umani fanno ogni giorno, e tuttavia, come si può vedere da questi e altri esempi, spesso si basa sulla comprensione profonda del mondo, che è attualmente al di là della portata delle nostre macchine: comprensione del senso comune e della fisica intuitiva, comprensione delle credenze e delle intenzioni degli altri, capacità di visualizzare e ragionare su causa ed effetto e molto altro ancora.
Stai cercando di insegnare macchine sulla lingua usando mondi fisici simulati. Perché?
Devo ancora vedere un bambino i cui genitori mettono un’enciclopedia nella culla e dicono “Vai a imparare”. Ed è quello che fanno i nostri computer oggi. Non penso che questi sistemi apprenderanno il modo in cui vogliamo o capiranno il mondo nel modo in cui vogliamo.
Quello che succede ai bambini è che ottengono un’esperienza tattile immediatamente nel mondo. Quindi i bambini iniziano a vedere il mondo e ad assorbire gli eventi e le proprietà degli oggetti. E poi il bambino alla fine sente input linguistici. Ed è questo input complementare che rende possibile la magia della comprensione.
Qual è un approccio migliore?
Un modo per ottenere una maggiore comprensione dell’intelligenza umana e quindi usare quella comprensione per creare macchine intelligenti. La ricerca dell’IA deve basarsi su idee provenienti dalla psicologia dello sviluppo, dalle scienze cognitive e dalle neuroscienze, ei modelli di intelligenza artificiale dovrebbero riflettere ciò che è già noto su come gli esseri umani apprendono e comprendono il mondo.
I veri progressi arriveranno solo quando i ricercatori usciranno dai nostri uffici e inizieranno a parlare con persone in altri campi. Insieme ci avvicineremo alla comprensione dell’intelligenza e scopriremo come replicarla in macchine intelligenti in grado di parlare, vedere e operare nel nostro mondo fisico.
La sfida di creare macchine veramente intelligenti è molto difficile, ma è anche una delle sfide più importanti che abbiamo.