SET DI DATI RILASCIATI DI RECENTE PER I RICERCATORI PER COMBATTERE COVID-19
Mentre i ricercatori setacciano numerosi database per combattere la minaccia del coronavirus, l’accesso tempestivo ai dati giusti è diventato fondamentale. Con l’urgenza di questa crisi di salute pubblica che si sta intensificando, è diventato indispensabile aprire l’accesso a dati pubblici affidabili. Questi, a loro volta, probabilmente porteranno collaborazioni cruciali all’interno della comunità di ricerca globale per scoprire nuove intuizioni per affrontare l’epidemia.
I set di dati aperti – nella loro forma originale e integrale – sono essenziali per ottenere una comprensione più profonda dell’attuale crisi. Questi dati, abbinati a interventi tecnologici come l’intelligenza artificiale e l’elaborazione del linguaggio naturale, hanno permesso di migliorare i modelli di previsione, fare previsioni preziose e analizzare l’impatto del coronavirus.
Inoltre, dato che la crisi è un problema in corso che solleva regolarmente nuove scoperte, mantenere asset di dati affidabili a cui i ricercatori possono rivolgersi è diventato fondamentale. In risposta all’urgenza di questa crisi, diverse grandi organizzazioni, tra cui Google e Amazon , hanno offerto ai ricercatori libero accesso ai loro set di dati aperti. Aggiungendo a un tesoro di set di dati raccolti da una coalizione di importanti gruppi di ricerca, nonché importanti istituti come John Hopkins, diamo un’occhiata ai set di dati che sono stati recentemente rilasciati su Covid-19:
Con effetto fino al 15 settembre, Google ha aperto l’accesso al suo repository di set di dati pubblici Covid-19 . Rivolta a ricercatori, data scientist e analisti di dati per scopi di ricerca e istruzione, la società li ha anche incoraggiati a utilizzare BigQuery ML per addestrare gratuitamente modelli ML avanzati nell’ambito di questo programma.
Secondo Google , ciò consentirà una maggiore partecipazione tra i ricercatori che collaborano per combattere collettivamente questa crisi. Con il lancio di questo programma, ricercatori e data scientist possono accedere ai dati da Google Cloud Console . Oltre a una descrizione dei dati, contiene anche query di esempio per far avanzare la ricerca.
Amazon ha recentemente annunciato di aver reso disponibile gratuitamente un lago dati AWS pubblico intorno a Covid-19. Definendolo un repository centrale per “set di dati aggiornati e curati” sulla malattia, consente ai ricercatori di studiare e analizzare i dati in un’unica posizione in modo efficiente.
Ospitato sul cloud AWS, il data lake AWS Covid-19 trasporta dati da Johns Hopkins, The New York Times e informazioni provenienti da oltre 45.000 articoli di ricerca riguardanti la malattia. La società afferma di aggiornare regolarmente questo repository con fonti che rendono sempre più pubblici i propri dati.
Catalogo dei dati Covid-19 della Banca mondiale
La Banca mondiale ha aderito a società tecnologiche e altre istituzioni che stanno mantenendo set di dati, di cui i ricercatori possono trarre vantaggio per rispondere in modo appropriato alla pandemia di Covid-19. Ha curato set di dati in vari settori, inclusi sanità e finanza .
Secondo l’istituto, i set di dati nel sottogruppo Covid-19 sono stati ricavati dalla ricerca del Gruppo della Banca mondiale, da varie pubblicazioni e dall’analisi dei metadati utilizzando parole chiave pertinenti.
Set di dati ad accesso aperto CAS
La divisione dati CAS dell’American Chemical Society ha aperto il proprio set di dati antivirali per supportare la ricerca sui trattamenti Covid-19. Questo set di dati contiene informazioni su 50.000 composti che potenzialmente hanno proprietà antivirali.
Leggi anche Il CEO di Infy afferma che le aziende devono collaborare con il governo, la società civile e le istituzioni sanitarie in mezzo alla crisi
Secondo CAS , il set di dati può consentire ai ricercatori di utilizzare le conoscenze chimiche precedentemente pubblicate con tecnologie emergenti come l’IA per accelerare la ricerca sui trattamenti per Covid-19.
Dati UE sul coronavirus COVID-19
Questo set di dati, gestito dal Centro europeo per la prevenzione e il controllo delle malattie (ECDC), ospita gli ultimi dati disponibili su Covid-19. Ciò comprende, a titolo esemplificativo, la curva epidemiologica e la distribuzione geografica dei casi nell’UE e nel mondo.
L’ECDC ha curato i dati relativi al numero di casi attivi di Covid-19 e ai relativi decessi utilizzando i rapporti delle autorità sanitarie globali. L’istituto ha monitorato l’epidemia con un occhio attento a perfezionare costantemente questo processo e garantire l’accuratezza dei dati.
Set di dati Covid-Net
Sugli approcci chiave adottati per lo screening dei pazienti con infezione da Covid-19 è stato quello di utilizzare le immagini della radiografia del torace. Ciò ha stimolato una serie di sistemi di intelligenza artificiale che mostrano risultati promettenti quando si tratta di rilevare accuratamente le infezioni Covid-19 usando queste immagini. Poiché questi sistemi di intelligenza artificiale basati sull’apprendimento profondo sono stati chiusi al pubblico, queste soluzioni e scoperte proposte sono disponibili al più ampia comunità di ricerca con Covid-Net . Si tratta di un progetto di rete neurale convoluzionale profondo per il rilevamento di questa malattia utilizzando un set di dati comprendente immagini radiografiche del torace. A partire da ora, questo set di dati contiene “13 800 immagini di radiografia del torace in 13.725 casi di pazienti provenienti da tre repository di dati ad accesso aperto”.