Mettere in discussione l’hype su AlphaFold
Le strutture proteiche si spostano e si trasformano in modo innato, a volte in modo molto drastico e talvolta in modi sottili quando si manifestano ligandi di piccole molecole.
Nel 2020, il braccio AI di Google AI DeepMind ha partecipato a una sfida di previsione della struttura delle proteine chiamata CASP o Critical Assessment of Structure Prediction e ha battuto altri 100 team nella risoluzione di uno dei problemi più difficili in Biologia: capire la forma 3D di una proteina da suoi amminoacidi.
Dopo due anni di questa svolta, il software di intelligenza artificiale AlphaFold di DeepMind ha compiuto rapidi passi avanti nella previsione delle strutture proteiche. L’anno scorso, DeepMind ha iniziato a pubblicare le previsioni di AlphaFold utilizzando un database disponibile pubblicamente creato in collaborazione con il Laboratorio europeo di biologia molecolare (EMBL). Questo set di dati iniziale includeva il 98% di tutte le proteine umane. Il mese scorso, AlphaFold ha rilasciato un database ampliato con oltre 200 milioni di strutture proteiche che comprendono quasi tutte le proteine esistenti in Science.
Per la maggior parte, questa impresa ha trasformato in credenti gli astanti che erano scettici sul ruolo dell’IA nel settore farmaceutico. Il ripiegamento delle proteine è stato un problema di 50 anni in biologia. Gli scienziati, sin dagli anni ’90, hanno cercato di addestrare i loro computer a prevedere le strutture delle proteine, ma in gran parte hanno riscontrato fallimenti. La ricompensa per aver trovato una soluzione a questo grande problema è stata immensa.
Le proteine sono i mattoni della vita con ogni struttura che ha una forma diversa. Comprendere come le strutture proteiche si ripiegano in forme tridimensionali significava avere un’idea del ruolo delle proteine e di come si comportavano queste macromolecole. Il ripiegamento errato delle proteine contribuisce allo sviluppo di malattie come l’Alzheimer. I risultati di AlphaFold potrebbero significare che gli scienziati saranno in grado di studiare le malattie neurodegenerative e progettare farmaci più velocemente.
Semplice meraviglia dell’IA o davvero utile?
Tutti questi progressi, tuttavia, comportano un avvertimento. Inutile dire che le previsioni di AlphaFold sono un successo per il riconoscimento di schemi e la disputa dei dati. Tuttavia, ciò che vale la pena ricordare, nonostante i grandi titoli dei giornali, è che le strutture proteiche progettate da AlphaFold sono previsioni e non le effettive strutture proteiche. Ciò rende i progetti molto meno preziosi dei dati effettivi delle strutture proteiche ottenute da raggi X e NMR o strumenti di risonanza magnetica nucleare.
Da un lato, il modello ha creato un’enorme banca di nuove previsioni sulla struttura delle proteine che non erano affatto previste, mentre dall’altro, l’algoritmo di AlphaFold fallisce quando si tratta di regioni proteiche disordinate. Una proteina intrinsecamente disordinata o IDP non ha una struttura 3D fissa, di solito durante l’assenza di altre macromolecole come l’RNA. Altre strutture proteiche non seguono mai la struttura in nessuna condizione. Inoltre, questa è la caratteristica principale delle proteine che le aiuta a funzionare.
Le strutture proteiche si spostano e si trasformano in modo innato, a volte in modo molto drastico e talvolta in modi sottili quando si manifestano ligandi di piccole molecole. Sarà difficile per AlphaFold essere in grado di prevedere queste modifiche considerando che ci sono pochissime proteine leganti di piccole molecole su cui allenarle. Sebbene ne siano state trovate solo circa 20, il numero di strutture molecolari è così grande che sono possibili infinite combinazioni.
La copertura su AlphaFold potrebbe anche essere esagerata nel contesto della scoperta di farmaci poiché le strutture proteiche non fanno quasi mai parte della fase di limitazione della velocità nel processo. I progetti che ruotano attorno alla scoperta di farmaci normalmente utilizzano cellule viventi per proteine pure. Inoltre, il contesto dato dalle strutture proteiche contribuisce a una parte molto minuscola della produzione di un farmaco . Gli scienziati della multinazionale svizzera di assistenza sanitaria Roche lo hanno confermato, affermando che, sebbene ciò possa essere utile, non ha risolto l’intero problema.
La scoperta di farmaci è un processo arduo in cui vengono condotti studi per capire come reagiscono i composti. Nel ciclo di vita di un farmaco , il successo è segnalato dal modo in cui le cellule e gli organi si comportano in un organismo specifico quando la proteina è disturbata. Nel profondo del processo, i dati reali sono ciò che aiuta a testare parametri come il metabolismo, la tossicologia e la farmacocinetica in cui una previsione di una proteina può difficilmente aiutare.
Nuovi orizzonti
D’altra parte, il software di AlphaFold impara dalle strutture di basso livello a cui è stato esposto. Nonostante il fatto che queste strutture possano non avere precedenti, offre un livello di base per fare previsioni di progettazione più concrete.
Questa mancanza di analogia è ciò che aiuta anche il caso di AlphaFold. Queste previsioni potrebbero aiutare il modello a creare proteine de novo , che è un processo inverso al problema del ripiegamento delle proteine. AlphaFold può aiutare gli scienziati a progettare strutture proteiche da zero anziché utilizzare una proteina nota. Anche se potrebbe volerci un po’ prima che ciò accada, il potenziale risiede nel fatto che gli esperti possono prevedere computazionalmente come si ripiegheranno le proteine e qual è la loro condizione stabile. Esiste la possibilità che queste proprietà possano essere ottimizzate in base all’applicazione scelta. Ciò alla fine potrebbe portare ad aree di ricerca completamente nuove in Biologia. Certo, mentre questo può accelerare il ritmo della ricerca nelle prime fasi, c’è poco spazio per accelerare il processo stesso di scoperta di farmaci.
In due casi recenti, i ricercatori dell’Università della California, San Francisco , hanno utilizzato AlphaFold e la microscopia elettronica criogenica per studiare Nsp2, una proteina parte dei virus mortali SARS-CoV-2. AlphaFold è stato in grado di determinare che la proteina ha un legame con ioni di zinco. La proteina svolge un ruolo nel legame dell’RNA, che potrebbe aprire altre aree di ricerca.
Gli approcci computazionali open source come quello di AlphaFold sono adatti anche nelle aree di ricerca per malattie che sono spesso trascurate. DeepMind ha collaborato con la Drugs for Neglected Disease Initiative o DNDi a Ginevra, che intende indagare su malattie rare come Chagas, una malattia pericolosa per la vita causata dal parassita Trypanosoma cruzi. I ricercatori hanno trovato una molecola che può legarsi a una proteina nel parassita e ucciderlo. AlphaFold può aiutare a identificare la struttura della proteina per curare la malattia di Chagas.
POULOMI CHATTERJEE da analyticsindiamag.com