La scoperta vetrosa offre una manna computazionale ai ricercatori di tutte le discipline
Un algoritmo controintuitivo può avere un’ampia gamma di entusiasmanti applicazioni scientifiche, accelerando potenzialmente il ritmo del ripiegamento computazionale delle proteine ed eliminando la necessità di grandi set di dati nell’apprendimento automatico
John Crocker si era aspettato di vedere una linea piatta – una familiare traccia orizzontale con alcuni lievi picchi e valli – ma la trama di energia davanti a lui si tuffò bruscamente verso il basso.
“È una scoperta irripetibile”, afferma Crocker. “Era come se la simulazione fosse caduta inaspettatamente in un profondo canyon su una superficie energetica. Questo è stato fortunato per due motivi. In primo luogo, si è rivelato un punto di svolta per il nostro studio sui materiali vetrosi. E in secondo luogo, canyon simili hanno il potenziale per aiutare gli altri ad affrontare gli stessi ostacoli computazionali che affrontiamo nel nostro campo, dagli informatici che lavorano su algoritmi di apprendimento automatico ai bioingegneri che studiano il ripiegamento delle proteine. Abbiamo ottenuto risultati significativi perché eravamo abbastanza curiosi da provare un metodo che non avrebbe dovuto funzionare. Ma lo ha fatto.
Il metodo è la metadinamica, un approccio computazionale per esplorare i paesaggi energetici. La sua applicazione controintuitiva è oggetto di una recente pubblicazione su PNAS da parte di un gruppo di Penn Engineers presso l’Università della Pennsylvania guidato da Crocker , Professore e Graduate Group Chair presso il Dipartimento di Ingegneria Chimica e Biologica (CBE), insieme a Robert Riggleman , Associate Professore in CBE, e Amruthesh Thirumalaiswamy , Ph.D. studente in CBE.
La maggior parte dei solidi sono vetri (o vetrosi). Classifichiamo il resto come cristalli. Queste categorizzazioni non si limitano al vetro o al cristallo come potremmo immaginarli, ma indicano invece come sono disposti gli atomi in qualsiasi solido. I cristalli hanno strutture atomiche pulite e ripetitive. Gli occhiali, invece, sono amorfi. I loro atomi e molecole assumono un vasto numero di configurazioni disordinate.
Le configurazioni vetrose si bloccano mentre perseguono, come fanno tutti i sistemi, i loro stati energetici più stabili e più bassi. Con un tempo sufficiente, gli occhiali si rilasseranno ancora molto lentamente in energia, ma i loro atomi disordinati lo rendono un processo lento e difficile.
Gli occhiali a bassa energia e stabili, o “occhiali ideali”, sono la chiave per un deposito di conoscenze che i ricercatori sono desiderosi di sbloccare.
Cercando di comprendere e infine replicare le condizioni dei materiali vetrosi che superano gli ostacoli delle proprie stranezze atomiche, gli scienziati utilizzano approcci sia sperimentali che teorici.
I laboratori, ad esempio, hanno fuso e raffreddato l’ambra fossilizzata per sviluppare processi per ricreare gli effetti incoraggianti che milioni di anni hanno avuto sulla sua ricerca vitrea di stati a bassa energia. Il team di Crocker, affiliato al Penn Institute for Computational Science (PICS) interdisciplinare , esplora le strutture fisiche con modelli matematici.
“Utilizziamo modelli computazionali per simulare le posizioni e i movimenti degli atomi in bicchieri diversi”, afferma Thirumalaiswamy. “Per tenere traccia delle particelle di un materiale, che sono così numerose e dinamiche che è impossibile visualizzarle in tre dimensioni, dobbiamo rappresentarle matematicamente in spazi virtuali ad alta dimensione. Se abbiamo 300 atomi, per esempio, dobbiamo rappresentarli in 900 dimensioni. Chiamiamo questi paesaggi energetici. Poi indaghiamo i paesaggi, percorrendoli quasi come esploratori”.
In questi modelli computazionali, singoli punti di configurazione, riassunti del movimento atomico, raccontano la storia dei livelli energetici di un bicchiere. Mostrano dove si è incastrato un vetro e dove potrebbe aver raggiunto uno stato di bassa energia.
Il problema è che fino ad ora i ricercatori non sono stati in grado di navigare nei paesaggi in modo sufficientemente efficiente per trovare questi rari casi di stabilità.
“La maggior parte degli studi fa passeggiate casuali intorno a paesaggi ad alta dimensione con un enorme costo computazionale. Ci vorrebbe una quantità infinita di tempo per trovare qualcosa di interessante. I paesaggi sono immensi e queste passeggiate sono ripetitive, facendo perdere una grande quantità di tempo fissati in un unico stato prima di passare a quello successivo”, afferma Riggleman.
E così, hanno colto l’occasione provando la metadinamica, un metodo che sembrava destinato a fallire.
La metadinamica è una strategia algoritmica sviluppata per esplorare l’intero panorama ed evitare la ripetizione. Assegna una penalità per il ritorno due volte nello stesso posto. La metadinamica non funziona mai negli spazi ad alta dimensione, tuttavia, perché ci vuole troppo tempo per costruire le penalità, annullando il potenziale di efficienza della strategia.
Tuttavia, mentre i ricercatori osservavano la loro tendenza energetica di configurazione verso il basso, si sono resi conto che aveva avuto successo.
“Non avremmo potuto immaginarlo, ma i paesaggi hanno dimostrato di avere questi canyon con pavimenti che sono solo bidimensionali o tridimensionali”, afferma Crocker. “Il nostro algoritmo è letteralmente andato a buon fine. Abbiamo trovato configurazioni a bassa energia che si verificano regolarmente in diversi bicchieri con un metodo che riteniamo possa essere rivoluzionario anche per altre discipline”.
Le potenziali applicazioni dei canyon del Crocker Lab sono di ampia portata.
Nei due decenni trascorsi da quando il Progetto Genoma Umano ha terminato la sua mappatura, gli scienziati hanno utilizzato modelli computazionali per ripiegare sequenze di peptidi in proteine. Le proteine che si piegano bene in natura hanno, attraverso l’evoluzione, trovato il modo di esplorare stati di bassa energia analoghi a quelli degli occhiali ideali.
Gli studi teorici sulle proteine utilizzano i paesaggi energetici per conoscere i processi di ripiegamento che creano le basi funzionali (o disfunzionali) per la salute biologica. Eppure misurare queste strutture richiede tempo, denaro ed energia che gli scienziati e le popolazioni che mirano a servire non devono risparmiare. Impantanati dalle stesse inefficienze computazionali che devono affrontare i ricercatori di materiali vetrosi, gli scienziati genomici potrebbero trovare successi simili con approcci basati sulla metadinamica, accelerando il ritmo della ricerca medica.
I processi di apprendimento automatico hanno molto in comune con le passeggiate casuali nello spazio multidimensionale. L’addestramento dell’intelligenza artificiale richiede un’enorme quantità di tempo e potenza computazionale e ha ancora molta strada da fare in termini di accuratezza predittiva.
Una rete neurale deve “vedere”, ad esempio, da migliaia a milioni di volti per acquisire abilità sufficienti per il riconoscimento facciale. Con un processo computazionale più strategico, l’apprendimento automatico potrebbe diventare più veloce, più economico e più accessibile. L’algoritmo di metadinamica può avere il potenziale per superare la necessità degli enormi e costosi set di dati tipici del processo.
Ciò non solo fornirebbe soluzioni per l’efficienza del settore, ma potrebbe anche democratizzare l’IA, consentendo alle persone con risorse modeste di fare la propria formazione e sviluppo.
“Stiamo ipotizzando che i paesaggi in questi diversi campi abbiano strutture geometriche simili alle nostre”, afferma Crocker. “Sospettiamo che potrebbe esserci una profonda ragione matematica per cui esistono questi canyon, e potrebbero essere presenti in questi altri sistemi correlati. Questo è il nostro invito; non vediamo l’ora che inizi il dialogo.