L’algoritmo AI legge e prevede i dati dei pazienti dalle cartelle cliniche elettroniche
Gli scienziati della Icahn School of Medicine del Monte Sinai hanno sviluppato un nuovo algoritmo automatizzato basato sull’intelligenza artificiale (AI) in grado di leggere e prevedere i dati dei pazienti dalle cartelle cliniche elettroniche (EHR).
Il nuovo metodo si chiama Phe2vec e può identificare con precisione i pazienti con determinate malattie. È stato dimostrato che è accurato quanto il metodo tradizionale più popolare, che richiede più lavoro manuale per essere eseguito.
Benjamin S. Glicksberg, PhD, è assistente professore di genetica e scienze genomiche. È anche membro dell’Hasso Plattner Institute for Digital Health at Mount Sinai (HPIMS) e autore senior dello studio.
“Continua a esserci un’esplosione nella quantità e nei tipi di dati archiviati elettronicamente nella cartella clinica di un paziente. Districare questa complessa rete di dati può essere molto gravoso, rallentando così i progressi nella ricerca clinica”, ha affermato Glicksberg. “In questo studio, abbiamo creato un nuovo metodo per estrarre i dati dalle cartelle cliniche elettroniche con l’apprendimento automatico che è più veloce e meno laborioso rispetto allo standard del settore. Ci auguriamo che questo sarà uno strumento prezioso che faciliterà ulteriori e meno prevenute ricerche nell’informatica clinica”.
Lo studio, che è stato pubblicato sulla rivista Patterns , è stato condotto da Jessica K. De Freitas, una studentessa laureata nel laboratorio del Dr. Glicksberg.
Standard del settore attuale
Gli scienziati attualmente si affidano a programmi e algoritmi per computer consolidati per estrarre le cartelle cliniche per nuove informazioni. Un sistema chiamato Phenotype Knowledgebase (PheKB) sviluppa e memorizza questi algoritmi. Il sistema è molto efficace nell’identificare correttamente la diagnosi di un paziente, ma i ricercatori devono esaminare molte cartelle cliniche e cercare prima i dati. Questi dati includono cose come test di laboratorio e prescrizioni.
L’algoritmo viene quindi programmato per guidare il computer alla ricerca di pazienti che dispongono di dati specifici della malattia, etichettati come “fenotipo”. Ciò consente al sistema di creare un elenco di pazienti, che deve poi essere controllato manualmente dai ricercatori. Se i ricercatori vogliono studiare una nuova malattia, sono tenuti a ricominciare il processo.
Il nuovo metodo
Con il nuovo metodo, i ricercatori consentono al computer di apprendere autonomamente come individuare i fenotipi delle malattie, il che fa risparmiare tempo e lavoro ai ricercatori. Il metodo Phe2vec si basava su studi precedenti condotti dal team.
Riccardo Miotto, PhD, è un ex Assistant Professor presso l’HPIMS e autore senior dello studio.
“In precedenza, abbiamo dimostrato che l’apprendimento automatico senza supervisione potrebbe essere una strategia altamente efficiente ed efficace per l’estrazione di cartelle cliniche elettroniche”, ha affermato Miotto. “Il potenziale vantaggio del nostro approccio è che apprende le rappresentazioni delle malattie dai dati stessi. Pertanto, la macchina svolge gran parte del lavoro che gli esperti normalmente farebbero per definire la combinazione di elementi di dati provenienti da cartelle cliniche che meglio descrivono una particolare malattia”.
Il computer è stato programmato per esaminare milioni di cartelle cliniche elettroniche e imparare a identificare le connessioni tra dati e malattie. La programmazione si basava su algoritmi di “incorporamento”, anch’essi precedentemente sviluppati dai ricercatori. Questi sono stati usati per studiare le reti di parole in varie lingue.
Uno di questi algoritmi si chiamava word2vec ed era particolarmente efficace. Il computer è stato quindi programmato per identificare la diagnosi di circa 2 milioni di pazienti i cui dati sono stati archiviati nel Mount Sinai Health System.
I ricercatori hanno quindi confrontato l’efficacia del nuovo e del vecchio sistema e hanno scoperto che per nove malattie su dieci testate, il nuovo sistema Phe2vec era altrettanto efficace, o leggermente migliore, dell’attuale processo di fenotipizzazione “gold standard” per identificare la diagnosi da EHR. Queste malattie potrebbero includere demenza, sclerosi multipla, anemia falciforme e altro ancora.
“Nel complesso i nostri risultati sono incoraggianti e suggeriscono che Phe2vec è una tecnica promettente per la fenotipizzazione su larga scala delle malattie nei dati delle cartelle cliniche elettroniche”, ha affermato il dott. Glicksberg. “Con ulteriori test e perfezionamenti, speriamo che possa essere utilizzato per automatizzare molte delle fasi iniziali della ricerca informatica clinica, consentendo così agli scienziati di concentrare i loro sforzi su analisi a valle come la modellazione predittiva”.