La ricerca farmaceutica contemporanea si confronta con una delle sfide più complesse della biologia molecolare: comprendere con precisione come le molecole terapeutiche interagiscono con le proteine cellulari e quali effetti producono una volta stabilito il legame. In questo contesto, un gruppo di ricercatori del Korea Advanced Institute of Science and Technology ha sviluppato un nuovo modello di intelligenza artificiale progettato per affrontare uno dei problemi più difficili della farmacologia strutturale. Il sistema, denominato GPCRact, è stato progettato per prevedere non solo se una molecola farmacologica candidata sia in grado di legarsi a una specifica proteina bersaglio, ma anche se tale legame produca effettivamente l’attivazione funzionale della proteina.

Il progetto è stato guidato dal professor Kwan-Soo Lee del Dipartimento di Ingegneria Biologica e Cerebrale e si concentra su una famiglia di proteine estremamente rilevante dal punto di vista farmacologico: i recettori accoppiati alle proteine G, noti come GPCR. Queste proteine sono localizzate sulla superficie delle cellule e funzionano come veri e propri sistemi di ricezione dei segnali biologici. Quando una molecola esterna, come un ormone, un neurotrasmettitore o un farmaco, si lega al recettore, il GPCR trasmette il segnale all’interno della cellula attivando una cascata di processi biochimici.

L’importanza di questa classe di proteine nel contesto della medicina è straordinaria. Nel corpo umano sono presenti circa ottocento varianti di GPCR e si stima che tra il trenta e il quaranta per cento dei farmaci attualmente disponibili agisca proprio su questi recettori. I GPCR sono infatti coinvolti in numerosi processi fisiologici fondamentali, tra cui la regolazione della frequenza cardiaca, il controllo della pressione sanguigna, la modulazione della percezione del dolore, la risposta immunitaria e diversi meccanismi neurobiologici legati all’umore e alle emozioni.

Nonostante questa centralità biologica, la progettazione di farmaci efficaci che agiscano sui GPCR rimane estremamente complessa. Il semplice legame tra una molecola e il recettore non garantisce infatti che il segnale venga trasmesso correttamente all’interno della cellula. Dopo il legame, la proteina subisce una serie di cambiamenti strutturali che determinano se il segnale sarà effettivamente propagato attraverso la struttura molecolare. Questo fenomeno prende il nome di propagazione del segnale allosterico, un processo in cui la modifica conformazionale di una regione della proteina influenza il comportamento funzionale di altre regioni distanti.

Tradizionalmente, i modelli computazionali utilizzati nella scoperta di farmaci si concentrano principalmente sulla previsione della probabilità di legame tra una molecola e il suo bersaglio proteico. Tuttavia, la capacità di prevedere l’effettiva attivazione della proteina richiede una comprensione molto più approfondita delle dinamiche strutturali interne. Il modello GPCRact è stato sviluppato proprio per affrontare questa complessità, integrando informazioni sulla struttura tridimensionale delle proteine con tecniche avanzate di apprendimento automatico.

Il team di ricerca ha progettato il sistema suddividendo il processo d’azione dei farmaci in tre fasi fondamentali. La prima riguarda l’interazione iniziale tra il farmaco e il recettore, ovvero il momento in cui la molecola si lega alla proteina bersaglio. La seconda fase riguarda la propagazione del segnale all’interno della struttura proteica, durante la quale il legame provoca una serie di modifiche conformazionali che si trasmettono lungo la catena di amminoacidi. La terza fase consiste nell’attivazione funzionale della proteina, che determina la trasmissione del segnale biologico all’interno della cellula.

Per modellare questo processo, i ricercatori hanno rappresentato la struttura tridimensionale delle proteine come una rete di relazioni atomiche, utilizzando un approccio di tipo grafico che consente di descrivere con precisione le interazioni tra i diversi componenti molecolari. In questa rappresentazione, ogni atomo o gruppo di atomi diventa un nodo della rete, mentre le interazioni chimiche e spaziali tra gli amminoacidi sono rappresentate come connessioni tra i nodi.

Per analizzare queste strutture complesse, il modello utilizza una variante avanzata delle reti neurali denominate Equivariant Graph Neural Networks (EGNN), progettate specificamente per elaborare informazioni strutturali nello spazio tridimensionale. A differenza delle reti neurali tradizionali, che trattano i dati come sequenze o matrici, le EGNN sono in grado di mantenere la coerenza delle informazioni geometriche quando analizzano strutture molecolari. Questo consente al modello di tracciare con grande precisione i cambiamenti conformazionali che avvengono all’interno della proteina durante il legame con il farmaco.

Accanto a questa architettura grafica, il sistema integra anche un meccanismo di attenzione, una tecnica ormai ampiamente utilizzata nei modelli di apprendimento profondo. Questo meccanismo permette all’algoritmo di identificare le interazioni più rilevanti tra gli amminoacidi della proteina, evidenziando i percorsi attraverso i quali il segnale allosterico si propaga all’interno della struttura molecolare.

Grazie alla combinazione di queste tecnologie, GPCRact è in grado di analizzare simultaneamente due aspetti fondamentali dell’interazione farmacologica: il segnale iniziale di legame tra la molecola e il recettore e i percorsi attraverso cui tale segnale si diffonde all’interno della proteina. Il risultato è una previsione dell’attività proteica che non si limita a stabilire se il farmaco si legherà al bersaglio, ma valuta anche la probabilità che il legame produca un effetto biologico effettivo.

Uno dei risultati più rilevanti ottenuti dal modello riguarda la sua capacità di affrontare strutture proteiche particolarmente complesse, che rappresentano spesso un ostacolo per i modelli predittivi tradizionali. Nei test condotti dal team di ricerca, GPCRact ha mostrato un miglioramento significativo nelle prestazioni di previsione dell’attività farmacologica rispetto ai sistemi precedenti.

Un altro aspetto importante del modello riguarda la sua interpretabilità. Molti sistemi di intelligenza artificiale utilizzati nella biologia computazionale funzionano come vere e proprie “scatole nere”, fornendo risultati predittivi senza spiegare i meccanismi che portano alla previsione. GPCRact cerca invece di superare questo limite identificando e visualizzando le principali vie di segnalazione all’interno della proteina che contribuiscono alla decisione del modello.

Questa capacità di spiegazione rende il sistema particolarmente utile per i ricercatori, perché consente di verificare se le previsioni dell’intelligenza artificiale siano coerenti con le conoscenze biologiche esistenti. In altre parole, il modello non si limita a fornire una risposta binaria sul comportamento di una molecola, ma offre anche indizi sulle dinamiche molecolari che determinano tale comportamento.

Secondo il team di ricerca, questo approccio potrebbe contribuire a migliorare significativamente sia l’affidabilità sia l’efficienza dei processi di scoperta dei farmaci. La possibilità di prevedere con maggiore precisione l’attività farmacologica di una molecola permette infatti di ridurre il numero di esperimenti necessari nelle fasi iniziali dello sviluppo, accelerando l’identificazione dei candidati più promettenti.

I ricercatori prevedono che GPCRact possa evolversi in una vera e propria piattaforma di intelligenza artificiale per la progettazione farmacologica di precisione, capace di analizzare non solo l’interazione tra farmaci e GPCR ma anche una gamma più ampia di proteine coinvolte in diverse patologie. L’obiettivo a lungo termine è sviluppare sistemi in grado di prevedere le conseguenze delle interazioni molecolari non soltanto a livello proteico, ma anche a livello cellulare e, in prospettiva, nell’intero organismo umano.

Il professor Lee ha sottolineato che il cuore dello studio consiste nell’integrare nel processo di apprendimento profondo i principi biologici che governano i cambiamenti strutturali allosterici. Quando una molecola si lega a una specifica regione della proteina, il suo effetto può propagarsi attraverso l’intera struttura modificando la funzione di altre regioni distanti. Comprendere e modellare questo fenomeno rappresenta uno dei passaggi chiave per progettare farmaci più efficaci e selettivi.

Di Fantasy