DeepMind aumenta la precisione di AlphaFold, con una nuova versione
La società di ricerca di proprietà di Alphabet DeepMind ha introdotto AlphaFold-Multimer, un modello in grado di prevedere la struttura dei complessi proteici multi-catena. Il nuovo modello aumenta significativamente l’accuratezza delle interfacce multimeriche previste rispetto all’AlphaFold a catena singola adattato all’input, pur mantenendo un’elevata precisione all’interno della catena .
La maggior parte delle catene proteiche singole ben strutturate potrebbe essere facilmente prevista utilizzando il precedente modello AlphaFold , ma la previsione di complessi proteici multi-catena è rimasta in molti casi una sfida, che AlphaFold-Multimer affronta prontamente.
AlphaFold-Multimer analizza più catene durante l’addestramento e l’inferenza, con il supporto nativo per la caratterizzazione multi-catena e la gestione della simmetria. Sono state apportate diverse modifiche al precedente sistema AlphaFold per adattarlo all’allenamento sul complesso proteico. AlphaFold-Multimer introduce un nuovo modo di selezionare sottoinsiemi di residui per l’addestramento e apporta varie piccole modifiche alle perdite della struttura e all’architettura del modello.
AlphaFold-Multimer è stato testato su un set di dati di riferimento di 17 proteine eterodimeriche senza modelli, dove ha raggiunto un’accuratezza almeno media su 14 bersagli e un’alta accuratezza su 6 bersagli, rispetto a 9 bersagli di accuratezza almeno media e 4 di alta accuratezza per il precedente stato dell’arte del sistema.
Il nuovo modello mostra che le metriche di confidenza fornite dal modello si correlano bene con la vera accuratezza, qualcosa che è vitale per l’utilizzabilità di un modello di previsione della struttura.
Deepmind afferma che questo metodo consentirà ai biologi di accelerare ulteriormente i recenti progressi nella bioinformatica strutturale e fungerà da trampolino di lancio verso l’esecuzione su pieghe più complesse, come le molecole di RNA e DNA.