Un modo più intelligente per sviluppare nuovi farmaci
Una nuova tecnica di intelligenza artificiale propone solo molecole candidate che possono essere effettivamente prodotte in laboratorio.
Le aziende farmaceutiche stanno utilizzando l’intelligenza artificiale per semplificare il processo di scoperta di nuovi farmaci. I modelli di apprendimento automatico possono proporre nuove molecole con proprietà specifiche che potrebbero combattere determinate malattie, facendo in pochi minuti ciò che l’uomo potrebbe richiedere mesi per ottenere manualmente.
Ma c’è un grosso ostacolo che trattiene questi sistemi: i modelli spesso suggeriscono nuove strutture molecolari difficili o impossibili da produrre in laboratorio. Se un chimico non può effettivamente produrre la molecola, le sue proprietà anti-malattie non possono essere testate.
Un nuovo approccio dei ricercatori del MIT vincola un modello di apprendimento automatico in modo che suggerisca solo strutture molecolari che possono essere sintetizzate. Il metodo garantisce che le molecole siano composte da materiali che possono essere acquistati e che le reazioni chimiche che si verificano tra quei materiali seguano le leggi della chimica.
Rispetto ad altri metodi, il loro modello proponeva strutture molecolari che hanno ottenuto punteggi più alti e talvolta migliori utilizzando valutazioni popolari, ma erano garantite per essere sintetizzabili. Il loro sistema impiega anche meno di un secondo per proporre un percorso sintetico, mentre altri metodi che propongono separatamente le molecole e poi ne valutano la sintetizzabilità possono richiedere diversi minuti. In uno spazio di ricerca che può includere miliardi di potenziali molecole, quei risparmi di tempo si sommano.
“Questo processo riformula il modo in cui chiediamo a questi modelli di generare nuove strutture molecolari. Molti di questi modelli pensano alla costruzione di nuove strutture molecolari atomo per atomo o legame per legame. Invece, stiamo costruendo nuove molecole elemento per elemento e reazione per reazione”, afferma Connor Coley, Henri Slezynger Career Development Assistant Professor nei dipartimenti di ingegneria chimica, ingegneria elettrica e informatica del MIT e autore senior dell’articolo.
Insieme a Coley sul giornale ci sono il primo autore Wenhao Gao, uno studente laureato, e Rocío Mercado, un post-dottorato. La ricerca viene presentata questa settimana alla Conferenza internazionale sulle rappresentazioni dell’apprendimento.
Costruzioni
Per creare una struttura molecolare, il modello simula il processo di sintesi di una molecola per garantire che possa essere prodotta.
Al modello viene fornito un insieme di elementi costitutivi praticabili, che sono sostanze chimiche che possono essere acquistate, e un elenco di reazioni chimiche valide con cui lavorare. Questi modelli di reazione chimica sono realizzati a mano da esperti. Il controllo di questi input consentendo solo determinate sostanze chimiche o reazioni specifiche consente ai ricercatori di limitare l’ampiezza dello spazio di ricerca per una nuova molecola.
Il modello utilizza questi input per costruire un albero selezionando i blocchi costitutivi e collegandoli attraverso reazioni chimiche, uno alla volta, per costruire la molecola finale. Ad ogni passaggio, la molecola diventa più complessa man mano che vengono aggiunte sostanze chimiche e reazioni aggiuntive.
Produce sia la struttura molecolare finale che l’albero delle sostanze chimiche e delle reazioni che la sintetizzerebbero.
“Invece di progettare direttamente la molecola del prodotto stesso, progettiamo una sequenza d’azione per ottenere quella molecola. Questo ci permette di garantire la qualità della struttura”, afferma Gao.
Per addestrare il loro modello, i ricercatori hanno inserito una struttura molecolare completa e una serie di elementi costitutivi e reazioni chimiche, e il modello impara a creare un albero che sintetizza la molecola. Dopo aver visto centinaia di migliaia di esempi, il modello impara a inventare da solo questi percorsi sintetici.
Ottimizzazione delle molecole
Il modello addestrato può essere utilizzato per l’ottimizzazione. I ricercatori definiscono determinate proprietà che vogliono ottenere in una molecola finale, dati determinati elementi costitutivi e modelli di reazione chimica, e il modello propone una struttura molecolare sintetizzabile.
“Ciò che è stato sorprendente è la grande frazione di molecole che puoi effettivamente riprodurre con un set di modelli così piccolo. Non sono necessari molti elementi costitutivi per generare una grande quantità di spazio chimico disponibile per la ricerca del modello”, afferma Mercado.
Hanno testato il modello valutando quanto bene potesse ricostruire molecole sintetizzabili. È stato in grado di riprodurre il 51 percento di queste molecole e ha impiegato meno di un secondo per ricrearle.
La loro tecnica è più veloce di altri metodi perché il modello non ricerca tutte le opzioni per ogni passaggio nell’albero. Ha una serie definita di sostanze chimiche e reazioni con cui lavorare, spiega Gao.
Quando hanno utilizzato il loro modello per proporre molecole con proprietà specifiche, il loro metodo ha suggerito strutture molecolari di qualità superiore che avevano affinità di legame più forti rispetto a quelle di altri metodi. Ciò significa che le molecole sarebbero in grado di legarsi meglio a una proteina e bloccare una determinata attività, come fermare la replicazione di un virus.
Ad esempio, quando proponevano una molecola che potrebbe agganciarsi a SARS-Cov-2, il loro modello ha suggerito diverse strutture molecolari che potrebbero essere in grado di legarsi meglio con le proteine virali rispetto agli inibitori esistenti. Come riconoscono gli autori, tuttavia, queste sono solo previsioni computazionali.
“Ci sono così tante malattie da affrontare”, dice Gao. “Spero che il nostro metodo possa accelerare questo processo in modo da non dover eseguire lo screening di miliardi di molecole ogni volta per un obiettivo di malattia. Invece, possiamo semplicemente specificare le proprietà che desideriamo e questo può accelerare il processo di ricerca di quel candidato farmaco”.
Il loro modello potrebbe anche migliorare le pipeline esistenti per la scoperta di farmaci. Se un’azienda ha identificato una particolare molecola che ha le proprietà desiderate, ma non può essere prodotta, potrebbe utilizzare questo modello per proporre molecole sintetizzabili che le somigliano molto, afferma Mercado.
Ora che hanno convalidato il loro approccio, il team prevede di continuare a migliorare i modelli di reazione chimica per migliorare ulteriormente le prestazioni del modello. Con modelli aggiuntivi, possono eseguire più test su determinati bersagli di malattie e, infine, applicare il modello al processo di scoperta dei farmaci.
Questa ricerca è stata supportata, in parte, dall’Office of Naval Research degli Stati Uniti e dal Machine Learning for Pharmaceutical Discovery and Synthesis Consortium.