Insegnare la fisica all’IA rende lo studente un maestro
L’integrazione della fisica nota negli algoritmi delle reti neurali consente loro di scoprire nuove informazioni sulle proprietà dei materiali
DURHAM, NC – I ricercatori della Duke University hanno dimostrato che incorporare la fisica nota negli algoritmi di apprendimento automatico può aiutare le imperscrutabili scatole nere a raggiungere nuovi livelli di trasparenza e comprensione delle proprietà dei materiali.
In uno dei primi progetti di questo genere, i ricercatori hanno costruito un moderno algoritmo di apprendimento automatico per determinare le proprietà di una classe di materiali ingegnerizzati noti come metamateriali e prevedere come interagiscono con i campi elettromagnetici.
Poiché ha dovuto prima considerare i noti vincoli fisici del metamateriale, il programma è stato essenzialmente costretto a mostrare il proprio lavoro. L’approccio non solo ha consentito all’algoritmo di prevedere con precisione le proprietà del metamateriale, ma lo ha fatto in modo più efficiente rispetto ai metodi precedenti fornendo al contempo nuove informazioni.
I risultati appaiono online la settimana del 9 maggio sulla rivista Advanced Optical Materials.
“Incorporando la fisica nota direttamente nell’apprendimento automatico, l’algoritmo può trovare soluzioni con meno dati di addestramento e in meno tempo”, ha affermato Willie Padilla, professore di ingegneria elettrica e informatica alla Duke. “Sebbene questo studio fosse principalmente una dimostrazione che mostrava che l’approccio poteva ricreare soluzioni note, ha anche rivelato alcune intuizioni sul funzionamento interno dei metamateriali non metallici che nessuno conosceva prima”.
I metamateriali sono materiali sintetici composti da molte caratteristiche ingegnerizzate individuali, che insieme producono proprietà che non si trovano in natura attraverso la loro struttura piuttosto che la loro chimica. In questo caso, il metamateriale è costituito da una grande griglia di cilindri di silicio che assomigliano a una base Lego.
A seconda delle dimensioni e della spaziatura dei cilindri, il metamateriale interagisce con le onde elettromagnetiche in vari modi, ad esempio assorbendo, emettendo o deviando lunghezze d’onda specifiche. Nel nuovo documento, i ricercatori hanno cercato di costruire un tipo di modello di apprendimento automatico chiamato rete neurale per scoprire come una gamma di altezze e larghezze di un singolo cilindro influenza queste interazioni. Ma volevano anche che le sue risposte avessero un senso.
“Le reti neurali cercano di trovare schemi nei dati, ma a volte gli schemi che trovano non obbediscono alle leggi della fisica, rendendo il modello che crea inaffidabile”, ha affermato Jordan Malof, assistente professore di ricerca di ingegneria elettrica e informatica alla Duke. “Forzando la rete neurale a obbedire alle leggi della fisica, le abbiamo impedito di trovare relazioni che potrebbero adattarsi ai dati ma non sono effettivamente vere”.
La fisica che il team di ricerca ha imposto alla rete neurale è chiamata modello di Lorentz, un insieme di equazioni che descrivono come le proprietà intrinseche di un materiale risuonano con un campo elettromagnetico. Invece di saltare direttamente alla previsione della risposta di un cilindro, il modello ha dovuto imparare a prevedere i parametri di Lorentz che ha poi utilizzato per calcolare la risposta del cilindro.
Incorporare quel passaggio in più, tuttavia, è molto più facile a dirsi che a farsi.
“Quando si rende una rete neurale più interpretabile, che è in un certo senso ciò che abbiamo fatto qui, può essere più difficile da mettere a punto”, ha affermato Omar Khatib, un ricercatore post-dottorato che lavora nel laboratorio di Padilla. “Abbiamo sicuramente avuto difficoltà a ottimizzare la formazione per imparare i modelli”.
Una volta che il modello ha funzionato, tuttavia, si è rivelato più efficiente delle precedenti reti neurali create dal gruppo per gli stessi compiti. In particolare, il gruppo ha scoperto che questo approccio può ridurre drasticamente il numero di parametri necessari al modello per determinare le proprietà del metamateriale.
Hanno anche scoperto che questo approccio basato sulla fisica è in grado di fare scoperte da solo.
Quando un’onda elettromagnetica viaggia attraverso un oggetto, non interagisce necessariamente con esso esattamente allo stesso modo all’inizio del suo viaggio come fa alla fine. Questo fenomeno è noto come dispersione spaziale. Poiché i ricercatori hanno dovuto modificare i parametri di dispersione spaziale per far funzionare il modello in modo accurato, hanno scoperto approfondimenti sulla fisica del processo che non conoscevano in precedenza.
“Ora che abbiamo dimostrato che questo può essere fatto, vogliamo applicare questo approccio a sistemi in cui la fisica è sconosciuta”, ha detto Padilla.
“Molte persone utilizzano le reti neurali per prevedere le proprietà dei materiali, ma ottenere dati di addestramento sufficienti dalle simulazioni è un dolore gigantesco”, ha aggiunto Malof. “Questo lavoro mostra anche un percorso verso la creazione di modelli che non necessitano di tanti dati, il che è utile su tutta la linea”.
Questa ricerca è stata supportata dal Dipartimento dell’Energia (DESC0014372).
CITAZIONE: “Imparare la fisica dei metamateriali completamente dielettrici con le reti neurali di Lorentz profonde”. Omar Khatib, Simiao Ren, Jordan Malof, Willie J. Padilla. Materiali ottici avanzati, 13 maggio 2022. DOI: 10.1002/adom.202200097