Potenti algoritmi utilizzati da aziende come Netflix, Facebook e Amazon potrebbero avere importanti implicazioni nel settore sanitario. Hanno dimostrato la capacità di prevedere il linguaggio biologico del cancro e di altre malattie neurodegenerative come l’Alzheimer.
Questa iniziativa è stata intrapresa da accademici del St. John’s College, Università di Cambridge, che hanno alimentato i big data prodotti nel corso di decenni in un modello di linguaggio informatico. L’obiettivo era vedere se l’intelligenza artificiale (AI) poteva fare scoperte più avanzate rispetto agli umani, e hanno scoperto proprio questo con la capacità della tecnologia di decifrare il linguaggio biologico.
Lo studio è stato pubblicato sulla rivista scientifica PNAS, dal titolo ” Imparare la grammatica molecolare dei condensati proteici da determinanti di sequenza e incorporamenti “. Secondo gli esperti, potrebbe essere utilizzato per “correggere gli errori grammaticali all’interno delle cellule che causano la malattia”.
Il professor Tuomas Knowles è l’autore principale dell’articolo e membro del St. John’s College.
“Portare la tecnologia di apprendimento automatico nella ricerca sulle malattie neurodegenerative e sul cancro è un punto di svolta assoluto. In definitiva, l’obiettivo sarà quello di utilizzare l’intelligenza artificiale per sviluppare farmaci mirati per alleviare drasticamente i sintomi o per prevenire del tutto la demenza “.
Algoritmi potenti
Gli algoritmi di apprendimento automatico utilizzati da aziende come Netflix e Facebook fanno previsioni altamente istruite sui consumatori e su cosa faranno dopo. Questo è ciò che accade quando Netflix consiglia un nuovo film o Facebook consiglia un nuovo amico. Gli assistenti vocali come Alexa e Siri possono riconoscere subito le persone e rispondere.
Il dottor Kadi Liis Saar è il primo autore dell’articolo e ricercatore presso il St. John’s College. Ha usato una tecnologia simile per addestrare un modello di linguaggio su larga scala, che mirava a identificare ciò che sta accadendo alle proteine durante la malattia.
“Il corpo umano ospita migliaia e migliaia di proteine e gli scienziati non conoscono ancora la funzione di molte di esse. Abbiamo chiesto a un modello di linguaggio basato su una rete neurale di imparare il linguaggio delle proteine ”, ha detto.
“Abbiamo specificamente chiesto al programma di imparare il linguaggio dei condensati biomolecolari mutaforma – goccioline di proteine che si trovano nelle cellule – che gli scienziati hanno davvero bisogno di capire per decifrare il linguaggio della funzione biologica e del malfunzionamento che causano il cancro e malattie neurodegenerative come l’Alzheimer. Abbiamo scoperto che poteva apprendere, senza che gli venisse detto esplicitamente, ciò che gli scienziati hanno già scoperto sul linguaggio delle proteine nel corso di decenni di ricerca “.
Gli scienziati ritengono che esistano diverse centinaia di malattie neurodegenerative, con le più comuni malattie di Alzheimer, Parkinson e Huntingon. L’Alzheimer colpisce 50 milioni di persone in tutto il mondo e durante la malattia le proteine formano grumi e uccidono le cellule nervose sane.
Condensati proteici e tecnologia PNL
Con un cervello sano, queste masse di proteine possono essere smaltite in modo efficace. Secondo scoperte più recenti, gli scienziati ora ritengono che alcune proteine disordinate formino condensati, che sono goccioline di proteine simili a liquidi. Questi non hanno una membrana e si fondono liberamente tra loro e possono formarsi e riformarsi.
“I condensati proteici hanno recentemente attirato molta attenzione nel mondo scientifico perché controllano eventi chiave nella cellula come l’espressione genica – come il nostro DNA viene convertito in proteine - e la sintesi proteica – come le cellule producono proteine”, ha detto il professor Knowles.
“Qualsiasi difetto connesso a queste goccioline di proteine può portare a malattie come il cancro. Questo è il motivo per cui portare la tecnologia di elaborazione del linguaggio naturale nella ricerca sulle origini molecolari del malfunzionamento delle proteine è vitale se vogliamo essere in grado di correggere gli errori grammaticali all’interno delle cellule che causano la malattia “, ha continuato.
“Abbiamo alimentato l’algoritmo con tutti i dati contenuti sulle proteine conosciute in modo che potesse apprendere e prevedere il linguaggio delle proteine nello stesso modo in cui questi modelli apprendono il linguaggio umano e come WhatsApp sa suggerirti le parole da usare”, afferma il dott. Saar ha detto.
“Poi abbiamo potuto chiederle della grammatica specifica che porta solo alcune proteine a formare condensati all’interno delle cellule. È un problema molto impegnativo e sbloccarlo ci aiuterà ad apprendere le regole del linguaggio della malattia “, ha continuato il dottor Saar.
I principali fattori alla base di questo progresso tecnologico sono una quantità crescente di dati disponibili, una maggiore potenza di calcolo e progressi tecnici. L’apprendimento automatico ha il potenziale per trasformare radicalmente la ricerca in queste aree, consentendo scoperte che non avrebbero mai potuto essere previste.
Secondo il dottor Saar, “l’apprendimento automatico può essere libero dai limiti di ciò che i ricercatori pensano siano gli obiettivi dell’esplorazione scientifica e ciò significherà che verranno scoperte nuove connessioni che non abbiamo nemmeno concepito. È davvero molto eccitante. “
La nuova rete è disponibile per i ricercatori di tutto il mondo e un numero crescente di scienziati viene coinvolto.