Una svolta per la tecnologia AI: superare un test scientifico di 8 ° grado
I ricercatori dell’Allen Institute hanno raggiunto un traguardo nell’intelligenza artificiale: una macchina pronta per la scienza delle scuole superiori. Forse anche al college.


SAN FRANCISCO – Quattro anni fa, oltre 700 scienziati informatici hanno gareggiato in un concorso per costruire un’intelligenza artificiale in grado di superare un test scientifico di terza media. C’erano $ 80.000 in premi in denaro sulla linea.
Sono stati bocciati tutti. Anche il sistema più sofisticato non ha potuto fare meglio del 60 percento durante il test. L’intelligenza artificiale non è in grado di eguagliare le competenze linguistiche e logiche che gli studenti dovrebbero avere quando entrano alle superiori.
Ma mercoledì l’Allen Institute for Artificial Intelligence, un importante laboratorio di Seattle, ha presentato un nuovo sistema che ha superato il test con spazio libero. Ha risposto correttamente a oltre il 90 percento delle domande in un test scientifico di terza media e oltre l’80 percento in un esame di terza media.
Il sistema, chiamato Aristo, indica che negli ultimi mesi i ricercatori hanno compiuto progressi significativi nello sviluppo dell’IA in grado di comprendere le lingue e imitare la logica e il processo decisionale degli umani.
I migliori laboratori di ricerca del mondo stanno rapidamente migliorando la capacità di una macchina di comprendere e rispondere al linguaggio naturale. Le macchine stanno migliorando nell’analizzare i documenti, trovare informazioni, rispondere alle domande e persino generare un linguaggio tutto loro .
Aristo è stato realizzato esclusivamente per test a scelta multipla. Ci sono voluti esami standard scritti per studenti a New York, sebbene l’Allen Institute abbia rimosso tutte le domande che includevano immagini e diagrammi. Rispondere a domande del genere avrebbe richiesto competenze aggiuntive che combinano la comprensione del linguaggio e la logica con la cosiddetta visione artificiale.
Alcune domande del test, come questa dell’esame di terza media, richiedevano poco più che il recupero di informazioni:
Un gruppo di tessuti che lavorano insieme per svolgere una funzione specifica è chiamato:
un organo
un organismo
un sistema
una cellula
Ma altri, come questa domanda dello stesso esame, richiedevano la logica:
Quale cambiamento molto probabilmente provocherebbe una diminuzione del numero di scoiattoli che vivono in una zona?
una diminuzione del numero di predatori
una diminuzione della concorrenza tra gli scoiattoli
un aumento del cibo disponibile
un aumento del numero di incendi boschivi
I ricercatori dell’Allen Institute hanno iniziato a lavorare su Aristo – volevano costruire un “Aristotele digitale” – nel 2013, subito dopo la fondazione del laboratorio da parte del miliardario di Seattle e del co-fondatore di Microsoft Paul Allen. Hanno visto i test scientifici standardizzati come un’alternativa più significativa ai tipici benchmark dell’IA, che si basavano su giochi come scacchi e backgammon o attività create esclusivamente per le macchine.
Un test scientifico non è qualcosa che può essere padroneggiato solo imparando le regole. Richiede connessioni usando la logica. Un aumento degli incendi boschivi, ad esempio, potrebbe uccidere gli scoiattoli o ridurre la fornitura di cibo necessaria per prosperare e riprodursi.
L’entusiasmo per i progressi compiuti da Aristo è ancora moderato tra gli scienziati che credono che le macchine siano ben lontane dal padroneggiare completamente il linguaggio naturale e persino dal duplicare la vera intelligenza .
“Non possiamo confrontare questa tecnologia con veri studenti umani e la loro capacità di ragionare”, ha detto Jingjing Liu, un ricercatore Microsoft che ha lavorato su molte delle stesse tecnologie dell’Allen Institute.
Ma i progressi di Aristo potrebbero estendersi a una gamma di prodotti e servizi, dai motori di ricerca su Internet ai sistemi di registrazione degli ospedali.


“Ciò ha conseguenze commerciali significative”, ha affermato Oren Etzioni, ex professore dell’Università di Washington che supervisiona l’Allen Institute. “Quello che posso dire – con assoluta fiducia – è che vedrai un’intera nuova generazione di prodotti, alcuni da start-up, altri da grandi aziende.”
La nuova ricerca potrebbe portare a sistemi in grado di portare avanti una conversazione decente. Ma potrebbe anche incoraggiare la diffusione di informazioni false .
“Siamo nella fase iniziale di questo”, ha detto Jeremy Howard, che supervisiona Fast.ai, un altro laboratorio influente, a San Francisco. “Siamo così lontani dal potenziale che non posso dire dove finirà”.
Nel 2016, quando un laboratorio di Londra ha costruito un sistema in grado di battere i migliori giocatori del mondo nell’antico gioco di Go , è stato ampiamente salutato come una svolta per l’intelligenza artificiale .
L’eccitazione del Dr. Etzioni, tuttavia, è stata ridotta. L’intelligenza artificiale non era così avanzata come potrebbe sembrare, ha detto, indicando la precedente competizione dell’Allen Institute che ha ostacolato i sistemi di intelligenza artificiale con un test scientifico di ottava elementare.
L’Istituto Allen ha migliorato questo precedente sforzo molto più rapidamente di quanto molti esperti, incluso il Dr. Etzioni, si aspettassero.
Il suo lavoro è stato in gran parte guidato da reti neurali , complessi sistemi matematici che possono apprendere compiti analizzando grandi quantità di dati. Individuando modelli in migliaia di foto di cani, ad esempio, una rete neurale può imparare a riconoscere un cane.
Negli ultimi mesi, i principali laboratori di intelligenza artificiale del mondo hanno creato reti neurali elaborate in grado di apprendere i capricci del linguaggio analizzando articoli e libri scritti dagli umani.
A Google, i ricercatori hanno costruito un sistema chiamato Bert che combinava migliaia di articoli di Wikipedia e una vasta biblioteca digitale di romanzi rosa, fantascienza e altri libri autopubblicati.
Analizzando tutto quel testo, Bert ha imparato a indovinare la parola mancante in una frase. Imparando quell’abilità, Bert ha assorbito enormi quantità di informazioni sui modi fondamentali in cui è costruita la lingua. E i ricercatori potrebbero applicare tale conoscenza ad altri compiti.
L’Allen Institute ha costruito il proprio sistema Aristo sulla tecnologia Bert. Hanno dato a Bert una vasta gamma di domande e risposte. Col tempo, ha imparato a rispondere a domande simili da solo.
Non molto tempo fa, i ricercatori del laboratorio hanno definito il comportamento del loro sistema di test una riga di codice software alla volta. A volte fanno ancora quella scrupolosa codifica. Ma ora che il sistema può imparare dai dati digitali da solo, può migliorare a un ritmo molto più veloce.
Sistemi come Bert – chiamati “modelli linguistici” – guidano ora una vasta gamma di progetti di ricerca, inclusi sistemi di conversazione e strumenti progettati per identificare false notizie. Con più dati e più potenza di elaborazione, i ricercatori ritengono che la tecnologia continuerà a migliorare.
Ma il Dr. Etzioni ha sottolineato che il futuro di questi sistemi era difficile da prevedere e che il linguaggio era solo un pezzo del puzzle.
La signora Liu e i suoi colleghi ricercatori Microsoft hanno cercato di costruire un sistema in grado di superare l’esame di laurea, il test richiesto per l’ammissione alla scuola di specializzazione.
La sezione linguistica era fattibile, ha detto, ma sviluppare le capacità di ragionamento richieste per la sezione matematica era un’altra questione. “Era troppo impegnativo.”

Di Cade Metz

The New York Times

Di ihal