L’intelligenza artificiale può unire set di dati medici sovrapposti e incompleti e quindi determinare quali variabili sono causative, offrendo nuove possibilità per i vecchi dati; gli scienziati di Babylon hanno dimostrato il potenziale dell’IA sui dati di tumori e strutture proteiche.
Una nuova Intelligenza Artificiale (AI) ha permesso ai ricercatori dell’IA, per la prima volta, di dimostrare un modo utile e affidabile di setacciare masse di dati correlati per individuare quando correlazione significa causalità. Unendo set di dati vecchi, sovrapposti e incompleti, questo nuovo metodo, ispirato alla crittografia quantistica, apre la strada ai ricercatori per raccogliere i risultati di studi medici che sarebbero altrimenti troppo costosi, difficili o non etici da eseguire. La ricerca è in corso di pubblicazione alla prestigiosa conferenza dell’Associazione per l’avanzamento dell’intelligenza artificiale (AAAI) a New York.
Il Dott. Saurabh Johri, Chief Science Officer di Babylon, ha dichiarato: “Fino ad ora, ci siamo limitati a mettere insieme le risposte degli studi necessari per acquisire tutti i dati in modo accurato. Ma quando abbiamo visto una correlazione tra obesità e bassa vitamina D in uno studio e obesità e insufficienza cardiaca in un altro, non siamo stati in grado di dire se la vitamina D abbia un ruolo causale nell’insufficienza cardiaca senza fare un altro, clinico estremamente costoso prova. Ora possiamo mettere insieme i pezzi del puzzle. “
Il dott. Ciarán Lee, ricercatore senior presso Babylon e ricercatore associato onorario presso l’University College di Londra, ha spiegato: “Gli scienziati hanno compreso che la correlazione non significa causalità; le vendite di gelati non causano scottature nonostante le percentuali di entrambe le riprese durante l’estate. Per trovare la causa esatta delle scottature prendiamo il sole o controlliamo il maggior numero possibile di variabili. Quindi, quando i nostri set di dati mostrano che una variazione dell’esposizione solare corrisponde a una variazione delle scottature solari, possiamo essere certi che l’esposizione solare era la variabile causale. Il problema è che il mondo reale è raramente pulito e ordinato e può essere davvero difficile controllare tutte le variabili e capire quale sia la causa ”.
Gli scienziati hanno iniziato a cercare altri modi per individuare le variabili causali. Una teoria nata dalla fisica suggerisce che tutto diventa più disordinato e complicato con il tempo, quindi una causa dovrebbe essere meno disordinata e complessa del suo effetto. Il dott. Lee ha dichiarato: “Se prendi il tuo set di dati e dai a ciascuna delle variabili un punteggio di complessità, puoi lavorare all’indietro e individuare quale sia la causa. Ma questo aiuta solo per quel set di dati: volevamo vedere se c’era un modo di combinare set di dati, quelli con lacune o in cui i ricercatori stavano ponendo domande diverse a ciò a cui sono interessati adesso. Potrebbe essere un punto di svolta. “
Il Dr. Lee è stato ispirato dalla crittografia quantistica. Le strane leggi della fisica quantistica significano che due utenti possono inviare un messaggio e quindi utilizzare una formula matematica per dimostrare se qualcun altro sta intercettando la loro conversazione. Il dottor Lee si rese conto che i set di dati potevano funzionare in modo simile, ma pensando a una potenziale variabile causativa da un altro set di dati come intercettatore. “Se un set di dati ci mostra che l’obesità provoca malattie cardiache e un’altra mostra che la vitamina D provoca obesità, possiamo usare una formula matematica per dimostrare se la vitamina D provoca obesità o meno. Questo è ciò che sta facendo la nostra IA. “
“Abbiamo combinato più variabili correlate da insiemi di dati medici incompleti e mostrato, con un alto grado di fiducia, quali correlazioni significano causalità”, ha affermato Lee. “Sono sinceramente entusiasta di ciò che questa IA può fare. Questa ovviamente non è una bacchetta magica che ci darà tutte le risposte, ma ci sono così tanti studi con dati mancanti, in cui i ricercatori vorrebbero aver testato qualcos’altro e poterlo combinare con uno studio fatto da qualcun altro o che aveva pensato porre le loro domande in modo diverso. Adesso possono. Che si tratti dell’efficacia dei farmaci antitumorali, dell’impatto delle statine o degli antidepressivi, dei pesticidi o dell’inquinamento atmosferico, l’IA dovrebbe essere in grado di far fronte a tutto. “
I ricercatori hanno testato l’IA sui set di dati sul cancro al seno e sulla segnalazione delle proteine, insieme a set di dati sintetici progettati per essere particolarmente complessi. In ogni caso, l’IA ha trovato la variabile causativa. In un caso ha valutato due set di dati separati di tumore al seno, uno che misurava il perimetro di un tumore al seno e l’altro la sua consistenza, e riferiva correttamente che nessuno dei due aveva causato l’altro, invece erano entrambi causati dal fatto che il tumore fosse maligno o benigno. Allo stesso modo, l’IA ha anche determinato la struttura di segnalazione tra due raccolte di proteine, anche se mancavano i dati congiunti da un numero di proteine in ciascun set di dati.
L’algoritmo utilizzato nella ricerca è disponibile nel documento e sul sito ad accesso aperto arXiv in modo che gli scienziati di tutto il mondo possano utilizzarlo per rivalutare set di dati sovrapposti e incompleti. I set di dati che sono stati testati sono tutti ad accesso aperto in modo che altri scienziati possano verificare la ricerca.