L’evoluzione biologica ha affinato la vita a livello molecolare per miliardi di anni, dando origine a proteine che svolgono funzioni vitali, dalla difesa contro le infezioni alla digestione del cibo. Queste molecole complesse sono costituite da lunghe catene di amminoacidi disposte in sequenze precise che determinano la loro struttura e funzione. Nonostante la natura abbia prodotto una vasta gamma di proteine, esiste un ampio spazio di sequenze amminoacidiche potenzialmente funzionali che non sono mai state esplorate.
Recentemente, un team di ricercatori ha utilizzato l’intelligenza artificiale (IA) per simulare 500 milioni di anni di evoluzione biologica, creando una nuova proteina fluorescente verde chiamata esmGFP. Questa proteina è stata progettata per emettere luce verde sotto radiazioni ultraviolette, una caratteristica che la rende utile in vari ambiti scientifici, come il tracciamento cellulare e la visualizzazione di processi biologici.
Il modello di IA utilizzato, denominato ESM3 (EvolutionaryScale Model 3), è un modello generativo di linguaggio sviluppato da EvolutionaryScale, una startup fondata da ex ricercatori di Meta. ESM3 è stato addestrato su un vasto dataset biologico, comprendente 771 miliardi di pacchetti di dati derivati da 3,15 miliardi di sequenze, 236 milioni di strutture e 539 milioni di caratteristiche funzionali, per un totale di oltre un trilione di teraflop, il più grande potere computazionale mai utilizzato in biologia. Questo addestramento ha permesso al modello di comprendere il “linguaggio” delle proteine e di generare nuove sequenze amminoacidiche con caratteristiche desiderate.
La creazione di esmGFP rappresenta un passo significativo nel campo del design proteico, poiché dimostra che l’IA può esplorare spazi di sequenze amminoacidiche che la natura non ha mai considerato. Questo approccio potrebbe portare a scoperte di nuove proteine con funzioni terapeutiche, applicazioni ambientali e altre utilità. Inoltre, supporta la teoria della contingenza nell’evoluzione, proposta dal biologo Stephen Jay Gould, secondo cui l’evoluzione potrebbe aver seguito percorsi molto diversi, portando a risultati alternativi.
Questo studio apre nuove prospettive nella biologia sintetica e nel design di proteine, offrendo strumenti per progettare molecole con funzioni specifiche che potrebbero non essere emerse attraverso i processi evolutivi naturali.