Biotech Labs fa affidamento sull’IA generativa per progettare nuove strutture proteiche
Chroma e RoseTTAFold Diffusion escogitano un nuovo metodo di sintesi proteica utilizzando modelli di diffusione da testo a immagine.
 
DALL.E 2 di OpenAI ha avuto successo con modelli da testo a immagine che generano facilmente immagini da descrizioni testuali. All’inizio di questa settimana, due laboratori biotecnologici , Generate Biomedicines e David Baker ‘s Group, si sono affidati all’intelligenza artificiale generativa, in particolare ai modelli di diffusione , per elaborare nuove strutture proteiche e, infine, farmaci migliori. 

La società terapeutica con sede a Boston Generate Biomedicines ha annunciato un programma chiamato Chroma che, secondo la società, è il ” DALL-E 2 della biologia “. Allo stesso modo, anche il team del biologo David Baker dell’Università di Washington ha ideato RoseTTAFoldDiffusion. Il modello può costruire progetti accurati per nuove proteine ​​che possono essere portate in vita in laboratorio. 

Perchè importa? I generatori di intelligenza artificiale possono essere utilizzati per creare progetti per proteine ​​con caratteristiche particolari, come struttura, dimensione o funzione, che consentono lo sviluppo di nuove proteine ​​in grado di svolgere compiti specifici su richiesta. Una volta sviluppato, questo può essere utilizzato per creare/identificare farmaci, che aiutano a regolare i processi sanitari di base negli esseri viventi; per esempio, quando ci ammaliamo, le proteine ​​ci aiutano a stare meglio. Lo scopo della sintesi proteica da parte dei generatori di intelligenza artificiale è aiutare i biologi ad ampliare l’elenco degli ingredienti delle proteine ​​naturali e creare nuovi farmaci su richiesta.

 
Sebbene i progetti di proteine ​​supportati dalla tecnologia non siano nuovi, sono stati per lo più obsoleti e hanno richiesto molto tempo per lavorare con proteine ​​grandi e complicate, che sono importanti nella cura di malattie difficili. I metodi di Chroma e Baker sono i primissimi programmi completi in grado di costruire progetti precisi per un’ampia varietà di proteine.

Come hanno fatto? In Chroma, il rumore del testo viene introdotto separando le catene di amminoacidi che compongono le proteine. Chroma assembla queste catene in una proteina da un gruppo casuale di esse. Per RoseTTAFold Diffusion, una seconda rete neurale viene utilizzata per prevedere la struttura delle proteine ​​e fornisce informazioni su come le parti di una proteina si incastrano tra loro, quindi utilizza queste informazioni per dirigere l’intero processo di generazione.

Baker’s Group e Generate Biomedicines hanno creato proteine ​​con diversi gradi di simmetria, come proteine ​​circolari, triangolari o esagonali. Generate Biomedicines ha fatto un passo avanti e ha progettato proteine ​​nelle forme delle 26 lettere dell’alfabeto latino e dei numeri da 0 a 10. Entrambi i gruppi sono in grado di creare nuove proteine ​​e abbinarle a strutture preesistenti.

Per verificare se Chroma ha prodotto progetti che potrebbero essere trasformati in medicine reali, Generate Biomedicines ha preso le sequenze per alcuni dei suoi progetti – le stringhe di amminoacidi che compongono la proteina – e le ha fatte passare attraverso un altro programma di intelligenza artificiale. Il risultato ha mostrato che si prevede che il 55% di loro si ripiegherà nella struttura generata da Chroma, il che suggerisce che si tratta di progetti per proteine ​​vitali. Allo stesso modo, alcuni dei progetti di RoseTTAFold Diffusion sono stati sviluppati in laboratorio dal team di Baker. Questo ha creato una nuova proteina che si lega all’ormone paratiroideo, che regola i livelli di calcio nel sangue.

Nel 2021, la società cinese di biotecnologie Helixon ha sviluppato Omegafold , che si è unito ad AlphaFold di DeepMind , RoseTTAFold e ESMFold di Meta AI. Quindi, rimane la domanda sul perché Generate Biomedicines abbia scelto di implementare RoseTTTAFold invece degli altri modelli di previsione proteica open source che hanno risultati di precisione migliori. 


All’inizio di quest’anno, il biologo algoritmico di Bangalore Manoj Gopalakrishnan ha creato Tapestry , un metodo quantitativo a round singolo per test molecolari estesi che offre significativi risparmi di tempo e costi rispetto ai test RTPCR convenzionali.

Sarà davvero interessante vedere come si evolverà nel prossimo futuro, dove le aziende di scienze della vita e biotecnologie stanno sperimentando modelli di previsione delle proteine ​​insieme agli strumenti di generazione di immagini come DALL.E 2 per sviluppare nuove strutture proteiche, contribuendo a loro volta a sviluppare meglio farmaci e soluzioni mediche. 

In un’interazione con AIM , il capo scienziato medico di Microsoft Research, Junaid Bajwa , ha affermato che il viaggio da quella che è la scoperta iniziale, alla traduzione in molecole reali e al portare quelle molecole nei casi d’uso del mondo reale.  

Mentre le principali grandi aziende tecnologiche si stanno concentrando sullo sviluppo di modelli di previsione delle proteine, inclusi artisti del calibro di Meta e DeepMind supportato da Google, Microsoft sembra essere più focalizzata sul lato dell’implementazione delle cose, dove ha collaborato con Novartis , Novo Nordisk e altri per applicare ai progressi della ricerca scientifica nel mondo reale, concentrandosi sul lato impatto delle cose. 

Di ihal