Immagine AI

Negli ultimi anni l’intelligenza artificiale ha iniziato a trasformare profondamente numerosi ambiti della ricerca scientifica, ma uno dei campi in cui il suo impatto potrebbe rivelarsi più rivoluzionario è quello della biologia molecolare. I progressi nelle tecniche di sequenziamento genetico hanno prodotto una quantità enorme di dati sul DNA di organismi viventi, rendendo sempre più complessa l’analisi delle informazioni contenute nei genomi. In questo contesto sono stati sviluppati nuovi modelli di intelligenza artificiale progettati per interpretare il linguaggio della genetica e per comprendere il funzionamento delle sequenze di nucleotidi che costituiscono il codice della vita. Tra questi sistemi emergono modelli di nuova generazione come Evo 2, una piattaforma di AI generativa sviluppata per analizzare, interpretare e persino progettare sequenze genetiche.

Il DNA può essere interpretato come un sistema di informazione biologica composto da una sequenza di nucleotidi organizzati in lunghe catene molecolari. Queste sequenze contengono le istruzioni necessarie per la sintesi delle proteine e per il funzionamento delle cellule. Comprendere il significato delle sequenze genetiche è uno degli obiettivi principali della biologia moderna, un processo iniziato con il sequenziamento del genoma umano e con il grande progetto internazionale che ha permesso di identificare e mappare le basi azotate presenti nel DNA umano.

La difficoltà principale nello studio del genoma deriva dall’enorme quantità di dati che devono essere analizzati. Il genoma umano contiene oltre tre miliardi di coppie di basi e la maggior parte di queste sequenze non è ancora completamente compresa. Anche piccole variazioni nella sequenza genetica possono influenzare la funzione delle proteine o determinare la comparsa di malattie. Per questo motivo la ricerca scientifica ha iniziato a utilizzare sistemi di intelligenza artificiale capaci di individuare pattern e correlazioni all’interno di enormi dataset genetici.

I nuovi modelli di AI applicati alla biologia sono progettati secondo principi simili a quelli dei modelli linguistici utilizzati per elaborare il linguaggio naturale. Invece di analizzare parole o frasi, questi sistemi elaborano sequenze di nucleotidi rappresentate dalle quattro basi fondamentali del DNA: adenina, timina, citosina e guanina. Attraverso tecniche di apprendimento automatico, il sistema impara a riconoscere le regolarità presenti nelle sequenze genetiche e a prevedere come determinate mutazioni possano influenzare il comportamento biologico delle cellule.

Uno degli esempi più avanzati di questa tecnologia è il modello Evo 2, sviluppato dall’Arc Institute in collaborazione con Nvidia e con università statunitensi come Stanford e l’Università della California. Questo sistema è stato addestrato su una quantità estremamente ampia di dati genetici, pari a circa 9 mila miliardi di nucleotidi provenienti da oltre 128 mila genomi appartenenti a specie diverse. Grazie a questo enorme dataset, il modello è in grado di analizzare sequenze genetiche molto lunghe e di individuare relazioni tra regioni del DNA anche molto distanti tra loro.

Una delle caratteristiche più rilevanti di questi modelli è la capacità di elaborare sequenze genetiche di grandi dimensioni. Evo 2 può analizzare segmenti di DNA lunghi fino a un milione di nucleotidi contemporaneamente, una scala di analisi molto superiore a quella utilizzata nei modelli precedenti. Questa capacità permette di studiare regioni del genoma che svolgono funzioni regolatorie complesse e che spesso sono difficili da interpretare con i metodi tradizionali.

L’intelligenza artificiale applicata alla genetica non si limita però alla lettura delle sequenze biologiche. I modelli generativi possono anche essere utilizzati per progettare nuove sequenze di DNA o per simulare modifiche genetiche in modo virtuale. In pratica, il sistema è in grado di suggerire come potrebbe essere modificata una sequenza genetica per ottenere un determinato risultato biologico, come la produzione di una proteina specifica o la correzione di una mutazione dannosa. Questo tipo di tecnologia apre prospettive importanti nel campo della biologia sintetica e dell’ingegneria genetica.

Uno degli ambiti di applicazione più promettenti riguarda lo studio delle malattie genetiche. Durante i test sperimentali, il modello Evo 2 è stato utilizzato per analizzare varianti del gene BRCA1, un gene noto per il suo ruolo nel rischio di tumore al seno. In queste analisi il sistema ha raggiunto un livello di accuratezza superiore al 90 % nel distinguere mutazioni innocue da mutazioni potenzialmente pericolose. Risultati di questo tipo suggeriscono che l’intelligenza artificiale potrebbe diventare uno strumento fondamentale per individuare le cause genetiche di molte patologie e per sviluppare terapie più mirate.

L’utilizzo dell’AI nella genetica si inserisce in un percorso scientifico iniziato negli ultimi anni con altre tecnologie rivoluzionarie. Un esempio importante è rappresentato dalla tecnica di editing genetico CRISPR, che consente di modificare il DNA in modo preciso e controllato. Allo stesso tempo sistemi di intelligenza artificiale come AlphaFold hanno dimostrato la capacità di prevedere la struttura tridimensionale delle proteine con un livello di precisione molto elevato, accelerando significativamente la ricerca biologica.

La combinazione tra tecniche di editing genetico e modelli di intelligenza artificiale potrebbe portare allo sviluppo di una nuova disciplina scientifica spesso definita biologia generativa. In questo campo l’AI viene utilizzata non solo per analizzare dati biologici, ma anche per progettare nuove sequenze genetiche e simulare il comportamento delle cellule. Questo approccio potrebbe accelerare la scoperta di farmaci, la progettazione di microrganismi utili in ambito industriale e la creazione di terapie geniche personalizzate.

Nonostante le enormi potenzialità, l’utilizzo di intelligenza artificiale nella manipolazione del DNA solleva anche questioni etiche e di sicurezza. La capacità di progettare sequenze genetiche artificiali potrebbe essere utilizzata in modo improprio per creare organismi pericolosi o modificare sistemi biologici in maniera non controllata. Per questo motivo i ricercatori stanno introducendo limitazioni e protocolli di sicurezza per impedire l’utilizzo dei modelli in applicazioni potenzialmente rischiose.

Di Fantasy