Centaur Labs ottiene $ 15 milioni per migliorare i dati per l’IA sanitaria
 
Secondo RBC e IDC, circa il 30% del volume di dati mondiale è creato dal settore sanitario . Si prevede che il tasso di crescita annuale composto dei dati sanitari tra il 2018 e il 2025 sarà del 36%, un tasso di crescita dei dati molto più rapido rispetto a quello di altri settori, compresi i servizi finanziari al 26%.

L’anno scorso, la quota dell’assistenza sanitaria di tutti i dati creati in tutto il mondo ammontava a 21 zettabyte o 21 trilioni di gigabyte. Anche l’anno scorso, il Covid-19 ha reso tutti noi consapevoli dell’importante ruolo di dati di alta qualità nel successo dell’arruolamento dell’IA nella battaglia dell’umanità contro le malattie e nel mantenimento della salute delle persone.

 
Centaur Labs , una startup focalizzata sul miglioramento della qualità dei dati sanitari, ha annunciato oggi un finanziamento di 15 milioni di dollari per portare avanti la propria missione di etichettare i dati medici del mondo. Il round di serie A è stato condotto da Matrix Partners con la partecipazione di altri fondi tra cui Accel , Global Founders Capital , Susa Ventures , Y Combinator e investitori individuali.

 

L’odierna “intelligenza artificiale” è la nuova generazione di machine learning.  Questo nuovo approccio di “apprendimento profondo” si basa su un’analisi statistica altamente sofisticata di volumi di dati molto grandi, “addestrando” le macchine a distinguere tra buono e cattivo, positivo e negativo, malattia e benessere.

Il primo passo nel processo di addestramento consiste nel presentare i dati etichettati al programma per computer come esempi di ciò che è giusto e ciò che è sbagliato in modo che questo tipo di programmi per computer (o algoritmi) possano effettuare classificazioni accurate dei dati non etichettati. Dati errati, tuttavia, possono portare a diagnosi, decisioni e risultati errati. L’efficacia di questi algoritmi, il loro potenziale per migliorare la salute e l’assistenza sanitaria, dipende in gran parte dall’accuratezza delle etichette dei dati sottostanti.

 
Centaur ha riunito una rete di decine di migliaia di studenti e professionisti di medicina provenienti da oltre 140 paesi. Questa rete etichetta principalmente i dati sull’app iOS gamificata di Centaur, DiagnosUs , in cui gli etichettatori migliorano le proprie abilità e competono tra loro. L’app è progettata per giudicare gli etichettatori in base alle loro prestazioni e premiare gli etichettatori più precisi con premi in denaro. È importante sottolineare che Centaur raccoglie più opinioni su ogni caso, con più opinioni raccolte sui casi più difficili, e combina in modo intelligente tali opinioni in etichette più accurate di quelle di un singolo esperto. Ogni settimana vengono fornite più di 1 milione di opinioni attraverso la piattaforma.

 
Il lavoro svolto da Centaur Labs e la sua attenzione alla qualità dei dati sanitari è in linea con la recente campagna di Andrew Ng, pioniere dell’intelligenza artificiale, per spostare lo sviluppo dell’intelligenza artificiale dall’essere incentrato sul modello all’essere incentrato sui dati. L’obiettivo è migliorare la qualità dei dati utilizzati per addestrare i programmi di intelligenza artificiale e costruire gli strumenti e i processi necessari per mettere i dati al centro del lavoro degli sviluppatori.

“Ora che i modelli sono avanzati fino a un certo punto, dobbiamo far funzionare anche i dati”, mi ha detto di recente Ng . E scrivendo sull’Harvard Business Review , Ng ha raccomandato di “concentrarsi su dati che coprono casi importanti e sono etichettati in modo coerente, in modo che l’IA possa imparare da questi dati ciò che dovrebbe fare… la chiave per creare questi preziosi sistemi di intelligenza artificiale è… i team”. che può programmare con i dati piuttosto che con il codice.”

Centaur Labs si concentra sul far funzionare molto bene i dati, in particolare i dati sanitari. È stata fondata da Erik Duhaime, CEO, mentre era uno studente di dottorato presso il Centro per l’intelligenza collettiva del MIT. Altri fondatori includono il suo amico di lunga data della Brown University, il CTO Zach Rausnitz, e il vicepresidente dell’ingegneria Tom Gellatly, che ha gestito il team di etichettatura dei dati presso la società di auto a guida autonoma Cruise Automation e in precedenza era il capo dello sviluppo mobile presso la startup di ridesharing Sidecar.

“L’IA impara come gli umani, con l’esempio, e per addestrare un algoritmo occorrono migliaia o addirittura milioni di esempi. È difficile curare grandi set di dati medici e quasi impossibile reperire etichette accurate da chi ha conoscenze mediche e formazione specializzata. La nostra piattaforma è costruita per supportare un’ampia gamma di attività mediche specialistiche e per scalare rapidamente a milioni di etichette”, ha affermato il co-fondatore e CEO Erik Duhaime in una nota.

Di ihal