Un nuovo modo per le reti neurali di simulare il ragionamento simbolico
I ricercatori dell’Università del Texas hanno scoperto un nuovo modo per le reti neurali di simulare il ragionamento simbolico. Questa scoperta apre un entusiasmante percorso verso l’unione di deep learning e intelligenza artificiale del ragionamento simbolico.
Nel nuovo approccio, ogni neurone ha una funzione specializzata che si riferisce a concetti specifici. “Apre la scatola nera dei modelli standard di deep learning pur essendo in grado di gestire problemi più complessi di quelli che l’IA simbolica ha tipicamente gestito”, ha detto Paul Blazek, ricercatore del Southwestern Medical Center dell’Università del Texas e uno degli autori del documento Nature . VentureBeat.
Questo lavoro integra la ricerca precedente sui metodi neurosimbolici come Clevrer del MIT , che ha mostrato alcune promesse nel prevedere e spiegare le possibilità controfattuali in modo più efficace delle reti neurali. Inoltre, i ricercatori di DeepMind hanno precedentemente elaborato un altro approccio alla rete neurale che ha superato gli approcci neurosimbolici all’avanguardia.
Le reti neurali dell’essenza imitano il ragionamento umano
Il team dell’Università del Texas ha coniato il termine “rete neurale dell’essenza” (ENN) per caratterizzare il suo approccio e rappresenta un modo di costruire reti neurali piuttosto che un’architettura specifica. Ad esempio, il team ha implementato questo approccio con architetture popolari come la rete neurale convoluzionale e le architetture di rete neurale ricorrente (RNN).
La grande differenza è che hanno eliminato la retropropagazione, che è una pietra angolare di molti processi di intelligenza artificiale. “È noto che la retropropagazione ha aperto le reti neurali profonde a un addestramento efficiente utilizzando metodi di ottimizzazione della discesa del gradiente, ma generalmente non è così che funziona la mente umana”, ha affermato Blazek. Gli ENN non usano la retropropagazione o la discesa del gradiente. Piuttosto, gli ENN imitano il processo di ragionamento umano, apprendono la struttura dei concetti dai dati e quindi costruiscono la rete neurale di conseguenza.
Blazek ha affermato che la nuova tecnica potrebbe avere applicazioni commerciali pratiche nei prossimi anni. Ad esempio, il team ha dimostrato alcune applicazioni ENN per scoprire automaticamente algoritmi e generare un nuovo codice per computer. “L’apprendimento profondo standard ha richiesto diversi decenni di sviluppo per arrivare dove è ora, ma gli ENN saranno in grado di prendere scorciatoie imparando da ciò che ha funzionato finora con l’apprendimento profondo”, ha affermato.
Le applicazioni promettenti della nuova tecnica includono quanto segue:
Scienza cognitiva : i ricercatori hanno progettato le ENN come prova di principio per la loro nuova teoria neurocognitiva. Integra le idee della filosofia della mente, della psicologia, delle neuroscienze e dell’intelligenza artificiale per esplorare come la mente umana elabora le informazioni. Il quadro teorico potrebbe rivelarsi utile nell’esplorazione di varie teorie e modelli di tutti questi campi.
Scoperta di algoritmi : i ricercatori hanno scoperto che gli ENN possono scoprire nuovi algoritmi, in modo simile a come possono farlo le persone.
Applicazioni ad alto rischio : la ricerca stabilisce gli elementi costitutivi di base per sistemi di deep learning spiegabili che possono essere meglio compresi prima dell’implementazione e dell’analisi post hoc .
IA robusta: c’è stata grande preoccupazione per gli attacchi contraddittori contro i sistemi di intelligenza artificiale black-box. Gli ENN sono naturalmente più resistenti agli attacchi contraddittori, in particolare per i casi d’uso di ragionamento simbolico.
Insegnamento automatico con dati limitati : un ENN può allenarsi su dati limitati e ideali e quindi generalizzare su esempi molto più complessi che non ha mai visto.
Lavorare a ritroso dalla biologia per capire il cervello
Contrariamente alla maggior parte delle ricerche sull’IA, i ricercatori hanno affrontato il problema da una prospettiva biologica. “Lo scopo originale del nostro lavoro era capire come la struttura neuronale del cervello elabora le informazioni”, ha detto Blazek.
Il team ha infine proposto un quadro generale per comprendere come il cervello elabora le informazioni e codifica i processi cognitivi. L’idea centrale è che ogni neurone fa una distinzione specializzata, indicando un concetto specifico o differenziando tra due concetti opposti. In altre parole, un tipo di neurone fa la distinzione “come A” contro “non come A” e l’altro tipo di neurone fa la distinzione “più simile ad A” contro “più simile a B.”.
Questi neuroni sono disposti in una gerarchia appropriata per integrare queste distinzioni e arrivare a conclusioni più sofisticate. Ci sono molti modi per progettare la distinzione specializzata fatta da ciascun neurone e per organizzare i neuroni per prendere decisioni complesse.
Questa teoria della comprensione dell’elaborazione delle informazioni neurali concorda con varie teorie e osservazioni della filosofia della mente, della psicologia e delle neuroscienze. “La cosa sorprendente di questo quadro è che i neuroni ragionano sulle idee esattamente nello stesso modo in cui i filosofi hanno sempre descritto il nostro processo di ragionamento”, ha detto Blazek.