Quale nuova biologia cellulare può rivelare l’IA semplicemente guardando le immagini? Molto!
Gli scienziati di Chan Zuckerberg Biohub sviluppano un metodo di apprendimento profondo che rivela ricche informazioni biologiche sulle proteine ​​e sull’architettura cellulare.

 

Gli esseri umani sono bravi a guardare le immagini e trovare schemi o fare confronti. Guarda una raccolta di foto di cani, ad esempio, e puoi ordinarle per colore, dimensione dell’orecchio, forma del viso e così via. Ma potresti confrontarli quantitativamente? E forse più intrigante, una macchina potrebbe estrarre informazioni significative da immagini che gli esseri umani non possono? 

Ora un team di scienziati di Chan Zuckerberg Biohub ha sviluppato un metodo di apprendimento automatico per analizzare e confrontare quantitativamente le immagini, in questo caso le immagini microscopiche di proteine, senza alcuna conoscenza preliminare. Come riportato in Nature Methods , il loro algoritmo, soprannominato “cytoself”, fornisce informazioni ricche e dettagliate sulla posizione e sulla funzione delle proteine ​​all’interno di una cellula. Questa capacità potrebbe accelerare i tempi di ricerca per i biologi cellulari ed eventualmente essere utilizzata per accelerare il processo di scoperta di farmaci e screening dei farmaci.

“Questo è molto eccitante: stiamo applicando l’IA a un nuovo tipo di problema e stiamo ancora recuperando tutto ciò che gli umani sanno, oltre a altro”, ha affermato Loic Royer , co-autore dello studio. “In futuro potremmo farlo per diversi tipi di immagini. Apre molte possibilità”.

Cytoself non solo dimostra la potenza degli algoritmi di apprendimento automatico, ma ha anche generato approfondimenti sulle cellule, gli elementi costitutivi di base della vita, e sulle proteine, gli elementi costitutivi molecolari delle cellule. Ogni cellula contiene circa 10.000 diversi tipi di proteine: alcune lavorano da sole, molte lavorano insieme, svolgono vari lavori in varie parti della cellula per mantenerle sane. “Una cellula è molto più organizzata nello spazio di quanto pensassimo prima. Questo è un importante risultato biologico su come è collegata la cellula umana”, ha affermato Manuel Leonetti , anche co-autore corrispondente dello studio.

E come tutti gli strumenti sviluppati presso CZ Biohub, cytoself è open source e accessibile a tutti. “Ci auguriamo che possa ispirare molte persone a utilizzare algoritmi simili per risolvere i propri problemi di analisi delle immagini”, ha affermato Leonetti.

Non importa un dottorato di ricerca, le macchine possono imparare da sole

Cytoself è un esempio di ciò che è noto come apprendimento auto-supervisionato, il che significa che gli esseri umani non insegnano nulla all’algoritmo sulle immagini delle proteine, come nel caso dell’apprendimento supervisionato. “Nell’apprendimento supervisionato devi insegnare la macchina uno per uno con esempi; è un sacco di lavoro e molto noioso”, ha detto Hirofumi Kobayashi, autore principale dello studio. E se la macchina è limitata alle categorie che gli esseri umani le insegnano, può introdurre pregiudizi nel sistema.

“Manu [Leonetti] credeva che le informazioni fossero già nelle immagini”, ha detto Kobayashi. “Volevamo vedere cosa poteva capire la macchina da sola”.

In effetti, il team, che comprendeva anche Keith Cheveralls, ingegnere del software CZ Biohub, è rimasto sorpreso dalla quantità di informazioni che l’algoritmo è stato in grado di estrarre dalle immagini.

“Il grado di dettaglio nella localizzazione delle proteine ​​era molto più alto di quanto avremmo pensato”, ha affermato Leonetti, il cui gruppo sviluppa strumenti e tecnologie per comprendere l’architettura cellulare. “La macchina trasforma ogni immagine proteica in un vettore matematico. Quindi puoi iniziare a classificare le immagini che sembrano uguali. Ci siamo resi conto che così facendo potevamo prevedere, con un’elevata specificità, le proteine ​​che lavorano insieme nella cellula semplicemente confrontando le loro immagini, il che è stato piuttosto sorprendente”.

Primo nel suo genere

Sebbene ci siano stati alcuni lavori precedenti sulle immagini delle proteine ​​utilizzando modelli auto-supervisionati o non supervisionati, mai prima d’ora l’apprendimento auto-supervisionato è stato utilizzato con così tanto successo su un set di dati così ampio di oltre 1 milione di immagini che coprono oltre 1.300 proteine ​​misurate da cellule umane vive, ha affermato Kobayashi, esperto di machine learning e imaging ad alta velocità.

Le immagini erano un prodotto di OpenCell di CZ Biohub , un progetto guidato da Leonetti per creare una mappa completa della cellula umana, inclusa la caratterizzazione dei circa 20.000 tipi di proteine ​​che alimentano le nostre cellule. Sono state pubblicate all’inizio di quest’anno su Science le prime 1.310 proteine ​​che hanno caratterizzato, comprese le immagini di ciascuna proteina (prodotta utilizzando un tipo di tag fluorescente) e le mappature delle loro interazioni reciproche. 

Cytoself è stato fondamentale per il successo di OpenCell (tutte le immagini sono disponibili su opencell.czbiohub.org ), fornendo informazioni molto granulari e quantitative sulla localizzazione delle proteine.

“La domanda su quali sono tutti i modi possibili in cui una proteina può localizzarsi in una cellula – tutti i luoghi in cui può essere e tutti i tipi di combinazioni di luoghi – è fondamentale”, ha affermato Royer. “I biologi hanno cercato di stabilire tutti i possibili luoghi in cui può essere, nel corso di decenni, e tutte le possibili strutture all’interno di una cellula. Ma questo è sempre stato fatto dagli esseri umani guardando i dati. La domanda è: quanto i limiti e i pregiudizi umani hanno reso imperfetto questo processo?

Royer ha aggiunto: “Come abbiamo dimostrato, le macchine possono farlo meglio di quanto possano fare gli esseri umani. Possono trovare categorie più fini e vedere distinzioni nelle immagini che sono estremamente fini”.

Il prossimo obiettivo del team per il cytoself è monitorare come piccoli cambiamenti nella localizzazione delle proteine ​​possono essere utilizzati per riconoscere diversi stati cellulari, ad esempio una cellula normale rispetto a una cellula cancerosa. Questo potrebbe essere la chiave per una migliore comprensione di molte malattie e facilitare la scoperta di farmaci. 

“Lo screening dei farmaci è fondamentalmente per tentativi ed errori”, ha detto Kobayashi. “Ma con cytoself, questo è un grande salto perché non avrai bisogno di fare esperimenti uno per uno con migliaia di proteine. È un metodo a basso costo che potrebbe aumentare notevolmente la velocità di ricerca”.

# # #

Informazioni su Chan Zuckerberg Biohub

Il Chan Zuckerberg Biohub è un centro di ricerca senza scopo di lucro che riunisce medici, scienziati e ingegneri della Stanford University; l’Università della California, Berkeley; e l’Università della California, San Francisco. In CZ Biohub lavorano alcuni dei più brillanti e audaci ingegneri, data scientist e ricercatori biomedici, che insieme alle nostre università partner cercano di comprendere i meccanismi fondamentali alla base della malattia e sviluppare nuove tecnologie che porteranno a diagnostica attuabile e terapie efficaci.

Di ihal