L’IA individua 40.000 scienziati di primo piano trascurati da Wikipedia

I software analizzano le notizie per trovare figure trascurate, e persino scrivono un articolo su di loro

L’IA è spesso criticata per la sua tendenza a perpetuare i pregiudizi della società , ma è ugualmente in grado di combatterli. L’apprendimento automatico è attualmente utilizzato per analizzare studi scientifici e notizie per identificare scienziati di spicco che non sono presenti su Wikipedia. Molti di questi scienziati sono donne e la loro omissione è particolarmente significativa nell’enciclopedia più popolare del mondo, dove l’ 82 percentodelle biografie è scritto su uomini.

La ricerca è stata condotta da una startup AI chiamata Primer come dimostrazione della competenza dell’azienda nell’elaborazione del linguaggio naturale (NLP). Questo è un sottocampo di intelligenza artificiale, ma vivace, basato sulla comprensione e la generazione di testo digitale. Wikipedia è spesso utilizzata come fonte per addestrare questo tipo di programmi, ma Primer vuole restituire il sito.

In un post sul blog , il direttore della scienza di Primer, John Bohannon, spiega come la società abbia sviluppato uno strumento chiamato Quicksilver (dal nome della tecnologia dei libri dell’autore fantascientifico Neal Stephenson “perché siamo nerd”) per leggere circa 500 milioni di documenti sorgente, setaccia le figure più citate e poi scrivi un articolo di base su di loro e sul loro lavoro.

Ad esempio, ecco un articolo scritto da AI su Teresa Woodruff, una scienziata che non ha una voce su Wikipedia ma è stata nominata una delle “Persone più influenti” della rivista Time nel 2013. Il suo lavoro include la progettazione di ovaie stampate in 3D per i topi.

Teresa K Woodruff è una scienziata riproduttiva della Northwestern University. [1] Si è specializzata in ginecologia e ostetricia. [2] È membro dell’Istituto di ricerca sulla salute delle donne. [1] Woodruff è uno scienziato riproduttivo e direttore del Women’s Health Research Institute della Feinberg School of Medicine della Northwestern University di Chicago. [3] Ha coniato il termine “oncofertility” nel 2006, e da allora è stata al centro del movimento. [4] Cinque anni dopo, ci riuscì: il 28 marzo, il team annunciò la nascita di Evatar, un apparato riproduttivo femminile in miniatura fatto di tessuti umani e di topo. [5] Ampiamente riconosciuta per il suo lavoro, detiene 10 brevetti negli Stati Uniti e nel 2013 è stata nominata nell’elenco “Most Influential Persons” della rivista Time. [6]
È un articolo di base, ma è convincente e chiaramente di provenienza, che è il punto di partenza perfetto per un editor di Wikipedia per creare un articolo su Woodruff, afferma Primer.

Ad oggi, la startup ha identificato 40.000 scienziati “scomparsi” la cui copertura è simile a individui che hanno articoli di Wikipedia, e ha pubblicato 100 sommari generati dall’IA . È stato anche coinvolto con tre editor di Wikipedia destinati a migliorare la rappresentazione online delle donne nella scienza. (Gli editori sono eventi in cui gli specialisti si insegnano a vicenda per creare e modificare articoli di Wikipedia, di solito per rafforzare la copertura della loro area tematica.) E come nota Bohannon, almeno una persona individuata dalla tecnologia di Primer ha già ricevuto un articolo di Wikipedia a causa di esso – Robottista canadese Joëlle Pineau .

“CON QUICKSILVER, NON DEVI MUOVERTI PER TROVARE NOMI MANCANTI.”
Jessica Wade, un fisico dell’Imperial College di Londra che ha scritto la nuova entrata di Pineau, ha detto a Wired dei vantaggi del sistema . “Wikipedia è incredibilmente parziale e la sottorappresentazione delle donne nella scienza è particolarmente negativa”, ha affermato Wade. “Con Quicksilver, non devi muoverti per trovare nomi mancanti e ottieni un’enorme quantità di informazioni ben fornite molto rapidamente.”

Primer afferma che la sua tecnologia si basa sul lavoro passato di Google e di altri ricercatori, tra cui uno studio pubblicato nel gennaio di quest’anno che utilizzava anche l’apprendimento automatico per generare articoli di base su Wikipedia. Tuttavia, la società afferma che i suoi obiettivi sono più pratici di questo. Piuttosto che usare Wikipedia come banco di prova per esperimenti, vuole creare strumenti con evidenti benefici per l’ecosistema di informazioni online.

A tal fine, Quicksilver non individua solo gli individui trascurati e genera articoli di brutta copia. Può anche essere usato per mantenere voci di Wikipedia e identificare quando non sono state aggiornate per un po ‘. La compagnia dice che la voce di Wikipedia per lo scienziato dei dati Aleksandr Kogan è un buon esempio. Kogan ha sviluppato l’app nel cuore dello scandalo di Cambridge Analytica e nel marzo di quest’anno ha creato una pagina di Wikipedia su di lui. Primer nota che il montaggio della voce di Kogan si è fermato a metà aprile (il che significa che gli aggiornamenti su Kogan, come il fatto che ha anche accesso ai dati di Twitter, devono ancora essere aggiunti).

Ovviamente, anche strumenti come questo possono essere suscettibili di pregiudizi. Se i punti di Primer trascuravano gli scienziati in base alla loro inclusione nelle notizie, allora potrebbe finire per riflettere gli interessi della stampa scientifica. Ma Bohannon è fermamente convinto che gli strumenti dell’azienda possano ancora essere utili come assistente di un processo guidato dall’uomo.

“Gli editori umani della più importante fonte di informazione pubblica possono essere supportati dall’apprendimento automatico”, ha dichiarato al Registro . “Gli algoritmi sono già utilizzati per rilevare atti di vandalismo e identificare articoli sottopopolati. Ma le macchine possono fare molto di più. “

Di ihal

Lascia un commento