Recupero delle informazioni e risposta alle domande: un caso di studio sulla letteratura scientifica COVID-19
Gli esperti di biosanità di tutto il mondo stanno dirigendo i loro sforzi verso lo studio del COVID-19. Questo sforzo genera un grande volume di pubblicazioni scientifiche a una velocità tale da rendere difficile l’effettiva acquisizione di nuove conoscenze. Pertanto, i Sistemi Informativi sono necessari per assistere gli esperti biosanitari nell’accesso, nella consultazione e nell’analisi di queste pubblicazioni. In questo lavoro sviluppiamo uno studio delle variabili coinvolte nello sviluppo di un sistema di risposta alle domande che riceve una serie di domande poste da esperti sulla malattia COVID-19 e sul suo virus causale SARS-CoV-2 e fornisce un elenco classificato di risposte di livello esperto a ogni domanda. In particolare, affrontiamo l’interrelazione delle fasi di Recupero delle informazioni e di Estrazione delle risposte.
I ricercatori creano
Un gruppo di ricercatori dell’Università dei Paesi Baschi ha sviluppato un prototipo per VIGICOVID, che è un sistema automatico di estrazione di informazioni per articoli scientifici COVID-19. Il sistema si basa su domande in linguaggio naturale per ottenere risposte relative al COVID-19.
Il progetto che coinvolge VIGICOVID è stato gestito dal Centro HiTZ dell’UPV/EHU, dal Gruppo NLP e IR dell’UNED e dall’Unità di Intelligenza Artificiale e Tecnologie del Linguaggio di Elhuyar.
La ricerca è stata pubblicata su ScienceDirect .
Modifica del paradigma di ricerca delle informazioni
Eneko Agirre è a capo del Centro HiTZ dell’UPV/EHU.
“Il paradigma della ricerca delle informazioni sta cambiando grazie all’intelligenza artificiale”, ha affermato Agirre. “Finora, quando si cercano informazioni su internet, si inserisce una domanda e la risposta va cercata nei documenti visualizzati dal sistema. Tuttavia, in linea con il nuovo paradigma, stanno diventando sempre più diffusi i sistemi che forniscono la risposta direttamente senza che sia necessario leggere l’intero documento”.
Xabier Saralegi è un ricercatore di Elhuyar.
“L’utente non richiede informazioni utilizzando parole chiave, ma pone direttamente una domanda.”
Il sistema si basa su due passaggi separati per cercare le risposte.
“In primo luogo, recupera i documenti che possono contenere la risposta alla domanda posta utilizzando una tecnologia che combina parole chiave con domande dirette. Ecco perché abbiamo esplorato le architetture neurali”, ha detto il dottor Saralegi.
Architettura neurale profonda
Il team ha fatto affidamento su un’architettura neurale profonda alimentata da esempi.
“Ciò significa che i modelli di ricerca e i modelli di risposta alle domande vengono addestrati mediante il deep machine learning “, ha continuato.
L’insieme di documenti viene prima estratto prima di essere rielaborato attraverso un sistema di domande e risposte, che aiuta a ottenere risposte specifiche.
“Abbiamo costruito il motore che risponde alle domande; quando il motore riceve una domanda e un documento, è in grado di rilevare se la risposta è o meno nel documento e, in tal caso, ci dice esattamente dove si trova”, ha affermato il dottor Agirre.
Secondo i ricercatori, erano contenti dei risultati del loro lavoro.
“Dalle tecniche e dalle valutazioni che abbiamo analizzato nei nostri esperimenti, abbiamo preso quelle che danno al prototipo i migliori risultati”, ha continuato il dottor Agirre. “Abbiamo escogitato un altro modo per eseguire ricerche ogni volta che le informazioni sono urgentemente necessarie e questo facilita il processo di utilizzo delle informazioni. A livello di ricerca, abbiamo dimostrato che la tecnologia proposta funziona e che il sistema fornisce buoni risultati”.
“Il nostro risultato è un prototipo di un progetto di ricerca di base. Non è un prodotto commerciale”, ha aggiunto Saralegi.
Detto questo, questi tipi di prototipi possono essere modellati in un breve periodo di tempo, il che significa che potrebbe non passare molto tempo prima che ci sia un prodotto commerciale.