Gli strumenti di intelligenza artificiale predicono il ruolo normativo del DNA e la struttura 3D
Gli algoritmi di modellazione delle sequenze potrebbero eventualmente portare a nuovi modi per combattere le malattie causate da mutazioni genetiche

 

Secondo due recenti studi su Nature Genetics  , i programmi di intelligenza artificiale (AI) di nuova concezione hanno predetto accuratamente il ruolo degli elementi regolatori del DNA e della struttura tridimensionale (3D) basata esclusivamente sulla sua sequenza grezza  . Questi strumenti potrebbero infine gettare nuova luce su come le mutazioni genetiche portano alla malattia e potrebbero portare a una nuova comprensione di come la sequenza genetica influenza l’organizzazione spaziale e la funzione del DNA cromosomico nel nucleo, ha affermato l’autore dello studio  Jian Zhou, Ph.D. , Professore Associato presso il  Dipartimento di Bioinformatica di Lyda Hill  presso UTSW.

“Presi insieme, questi due programmi forniscono un quadro più completo di come i cambiamenti nella sequenza del DNA, anche nelle regioni non codificanti, possono avere effetti drammatici sulla sua organizzazione e funzione spaziale”, ha affermato il dott. Zhou, membro  dell’Harold C. Simmons Comprehensive Cancer Center , uno studioso della Lupe Murchison Foundation in ricerca medica e uno studioso del Cancer Prevention and Research Institute of Texas (CPRIT).

Solo l’1% circa del DNA umano codifica le istruzioni per la produzione di proteine. La ricerca negli ultimi decenni ha dimostrato che gran parte del materiale genetico non codificante rimanente contiene elementi regolatori – come promotori, potenziatori, silenziatori e isolanti – che controllano il modo in cui viene espresso il DNA codificante. Il modo in cui la sequenza controlla le funzioni della maggior parte di questi elementi regolatori non è ben compreso, ha spiegato il dottor Zhou.

Per comprendere meglio queste componenti normative, lui e i suoi colleghi dell’Università di Princeton e del Flatiron Institute hanno sviluppato un modello di apprendimento profondo chiamato  Sei , che ordina accuratamente questi frammenti di DNA non codificante in 40 “classi di sequenza” o lavori, ad esempio come potenziatore per attività genica delle cellule staminali o delle cellule cerebrali. Queste 40 classi di sequenza, sviluppate utilizzando quasi 22.000 set di dati da studi precedenti che studiano la regolazione del genoma, coprono oltre il 97% del genoma umano. Inoltre, Sei può valutare qualsiasi sequenza in base alla sua attività prevista in ciascuna delle 40 classi di sequenza e prevedere l’impatto delle mutazioni su tali attività.

Applicando Sei ai dati genetici umani, i ricercatori sono stati in grado di caratterizzare l’architettura regolatoria di 47 tratti e malattie registrati nel database della biobanca britannica e spiegare come le mutazioni negli elementi regolatori causino patologie specifiche. Tali capacità possono aiutare a ottenere una comprensione più sistematica di come i cambiamenti della sequenza genomica sono collegati a malattie e altri tratti. I risultati sono stati pubblicati questo mese.

A maggio, il dottor Zhou  ha segnalato  lo sviluppo di uno strumento diverso, chiamato Orca, che prevede l’architettura 3D del DNA nei cromosomi in base alla sua sequenza. Utilizzando set di dati esistenti di sequenze di DNA e dati strutturali derivati ​​da studi precedenti che hanno rivelato le pieghe, le torsioni e le svolte della molecola, il dott. Zhou ha addestrato il modello a creare connessioni e valutato la capacità del modello di prevedere la struttura a varie scale di lunghezza.

I risultati hanno mostrato che Orca ha predetto le strutture del DNA sia piccole che grandi in base alle loro sequenze con elevata precisione, comprese le sequenze che trasportano mutazioni associate a varie condizioni di salute tra cui una forma di leucemia e malformazioni degli arti. Orca ha anche consentito ai ricercatori di generare nuove ipotesi su come la sequenza del DNA controlla la sua struttura 3D locale e su larga scala.

Il dottor Zhou ha affermato che lui e i suoi colleghi hanno in programma di utilizzare Sei e Orca, che sono entrambi pubblicamente disponibili sui server Web e come codice open source, per esplorare ulteriormente il ruolo delle mutazioni genetiche nel causare le manifestazioni molecolari e fisiche delle malattie – ricerca che alla fine potrebbe portare a nuovi modi per trattare queste condizioni.

Lo studio Orca è stato sostenuto da sovvenzioni da CPRIT (RR190071), National Institutes of Health (DP2GM146336) e UT Southwestern Endowed Scholars Program in Medical Science.

Informazioni sull’UT Southwestern Medical Center

UT Southwestern, uno dei principali centri medici accademici della nazione, integra la ricerca biomedica pionieristica con cure cliniche e istruzione eccezionali. La facoltà dell’istituto ha ricevuto sei premi Nobel e comprende 26 membri della National Academy of Sciences, 17 membri della National Academy of Medicine e 14 ricercatori dell’Howard Hughes Medical Institute. La facoltà a tempo pieno di oltre 2.900 docenti è responsabile di progressi medici rivoluzionari e si impegna a tradurre rapidamente la ricerca scientifica in nuovi trattamenti clinici. I medici dell’UT Southwestern forniscono assistenza in oltre 80 specialità a oltre 100.000 pazienti ospedalizzati, oltre 360.000 casi di pronto soccorso e supervisionano quasi 4 milioni di visite ambulatoriali all’anno.

Di ihal