L’Intelligenza Artificiale (IA) ha lasciato un’impronta indelebile nelle nostre vite. Per migliorare ulteriormente le capacità dell’IA, i ricercatori dell’UCLA e del Laboratorio di ricerca dell’esercito degli Stati Uniti hanno presentato un approccio unico che combina la consapevolezza della fisica con tecniche basate sui dati nell’ambito della visione artificiale.
Lo studio, pubblicato su Nature Machine Intelligence, propone una metodologia ibrida rivoluzionaria per migliorare la percezione, l’interazione e la reazione dei macchinari basati sull’IA rispetto all’ambiente circostante in tempo reale. Questo è fondamentale per veicoli autonomi e robot ad azione di precisione.
Finora, la visione artificiale, che consente all’IA di comprendere e dedurre le proprietà del mondo fisico dalle immagini, si è concentrata principalmente sull’apprendimento automatico basato sui dati. Allo stesso tempo, la ricerca basata sulla fisica ha cercato di svelare i principi fisici che sottendono molte sfide della visione artificiale. Tuttavia, integrare la comprensione della fisica nel regno delle reti neurali si è rivelato difficile.
In una svolta significativa, lo studio dell’UCLA si propone di combinare la profonda comprensione dei dati e l’expertise della fisica nel mondo reale, creando un’intelligenza artificiale ibrida con capacità potenziate. Achuta Kadambi, autore corrispondente dello studio e assistente professore di ingegneria elettrica e informatica presso la Samueli School of Engineering dell’UCLA, spiega: “Le forme di inferenza sensibili alla fisica possono consentire alle auto di guidare in modo più sicuro o ai robot chirurgici di essere più precisi”.
Il team di ricerca ha delineato tre modi innovativi per integrare la fisica nell’intelligenza artificiale della visione artificiale:
- Infondere la fisica nei set di dati dell’IA: questo comporta l’etichettatura di oggetti con informazioni aggiuntive, come la loro potenziale velocità o peso, simile ai personaggi nei videogiochi.
- Integrazione della fisica nelle architetture di rete: questa strategia prevede l’esecuzione dei dati attraverso un filtro di rete che codifica le proprietà fisiche in ciò che le telecamere acquisiscono.
- Incorporare la fisica nella funzione di perdita di rete: qui, la conoscenza basata sulla fisica viene sfruttata per assistere l’IA nell’interpretazione dei dati di addestramento basati sulle sue osservazioni.
Queste linee di ricerca sperimentali hanno già prodotto risultati promettenti nel miglioramento della visione artificiale. Ad esempio, l’approccio ibrido consente all’IA di tracciare e prevedere il movimento di un oggetto in modo più preciso e può produrre immagini accurate e ad alta risoluzione da scene oscurate da condizioni meteorologiche avverse.
I ricercatori sono ottimisti sul fatto che i continui progressi in questa doppia modalità di approccio potrebbero portare le IA basate sull’apprendimento profondo a imparare autonomamente le leggi della fisica. Ciò potrebbe segnare una nuova frontiera nelle tecnologie di visione artificiale basate sull’IA, aprendo la strada a un’applicazione più sicura e precisa dell’IA in vari settori, tra cui veicoli autonomi e robotica chirurgica.
Lo studio è stato sostenuto in parte da una sovvenzione dell’Army Research Laboratory ed è stato co-autore dello scienziato informatico dell’Army Research Laboratory Celso de Melo e dei membri della facoltà dell’UCLA Stefano Soatto, Cho-Jui Hsieh e Mani Srivastava. Ulteriori finanziamenti sono arrivati da sovvenzioni della National Science Foundation, dall’Army Young Investigator Program, dalla Defense Advanced Research Projects Agency, da Intrinsic (una società Alphabet) e da Amazon.