L’industria dell’IA si basa sulla disuguaglianza geografica e sociale, come mostra una ricerca
Il braccio della disuguaglianza globale è lungo, rendendosi visibile in particolare nello sviluppo di sistemi di intelligenza artificiale e apprendimento automatico. In un recente articolo , i ricercatori della Cornell, dell’Universite de Montreal, del National Institute of Statistical Sciences (USA) e di Princeton sostengono che questa disuguaglianza nel settore dell’IA comporta una concentrazione dei profitti e solleva il pericolo di ignorare i contesti in cui l’IA viene applicata.
Poiché i sistemi di intelligenza artificiale diventano sempre più radicati nella società, hanno affermato, i responsabili dello sviluppo e dell’implementazione di tali sistemi ne trarranno profitto in larga misura. E se questi attori si trovano prevalentemente in potenze economiche come Stati Uniti, Cina e UE, una quota sproporzionata di benefici economici cadrà all’interno di queste regioni, aggravando la disuguaglianza.
Che sia esplicitamente in risposta a questa disuguaglianza o meno, sono state fatte richieste per una più ampia inclusione nello sviluppo dell’IA. Allo stesso tempo, alcuni hanno riconosciuto i limiti dell’inclusione . Ad esempio, in un’analisi delle pubblicazioni in due importanti sedi di conferenze sull’apprendimento automatico, NeurIPS 2020 e ICML 2020, nessuno dei primi 10 paesi in termini di indice di pubblicazione si trovava in America Latina, Africa o Sud-est asiatico, i coautori di questo nuovo nota di studio. Inoltre, l’elenco completo delle prime 100 università e delle prime 100 società per indice di pubblicazione non includeva aziende o università con sede in Africa o America Latina.
Questa disuguaglianza si manifesta in parte nella raccolta dei dati. Ricerche precedenti hanno scoperto che ImageNet e OpenImages, due grandi set di dati di immagini disponibili pubblicamente, sono statunitensi ed euro-centrici. I modelli addestrati su questi set di dati hanno prestazioni peggiori con le immagini dei paesi del Sud del mondo . Ad esempio, le immagini di sposi sono classificate con minore precisione quando provengono dall’Etiopia e dal Pakistan, rispetto alle immagini di sposi dagli Stati Uniti. In questo senso, a causa del modo in cui immagini di parole come “matrimonio” o “spezie” sono presentate in culture nettamente diverse, i sistemi di riconoscimento degli oggetti disponibili pubblicamente non riescono a classificare correttamente molti di questi oggetti quando provengono dal Sud del mondo.
Le etichette, le annotazioni da cui i modelli di intelligenza artificiale apprendono le relazioni nei dati, portano anche i segni distintivi della disuguaglianza. Un luogo importante per il lavoro di etichettatura in crowdsourcing è Amazon Mechanical Turk, ma si stima che meno del 2% dei lavoratori di Mechanical Turk provenga dal Sud del mondo, con la stragrande maggioranza proveniente da Stati Uniti e India. Non solo le attività sono monotone e gli stipendi bassi – su Samasource, un’altra piattaforma per carichi di lavoro di crowdsourcing, i lavoratori guadagnano circa $ 8 al giorno – ma esistono una serie di barriere alla partecipazione. Sono necessari un computer e una connessione Internet affidabile e su Amazon Mechanical Turk, i conti bancari statunitensi e le carte regalo sono le uniche forme di pagamento.
Come sottolineano i ricercatori, ImageNet, che è stato essenziale per i recenti progressi nella visione artificiale, non sarebbe stato possibile senza il lavoro di etichettatori di dati. Ma gli stessi lavoratori di ImageNet guadagnavano un salario medio di $ 2 l’ora, con solo il 4% che guadagnava più del salario minimo federale degli Stati Uniti di $ 7,25 all’ora – di per sé molto diverso da un salario dignitoso.
“Come [una] parte significativa della pipeline di raccolta dei dati, l’etichettatura dei dati è un lavoro estremamente retribuito che coinvolge compiti meccanici e ripetitivi che non offrono spazio per la mobilità verso l’alto”, hanno scritto i coautori. “Gli individui possono non richiedere molte competenze tecniche per etichettare i dati, ma non sviluppano nemmeno abilità tecniche significative. L’anonimato di piattaforme come Mechanical Turk di Amazon inibisce la formazione di relazioni sociali tra l’etichettatrice e il cliente che altrimenti avrebbero potuto portare a ulteriori opportunità educative o una migliore remunerazione. Sebbene i dati siano fondamentali per i sistemi di IA odierni, gli etichettatori di dati ricevono solo una parte sproporzionatamente piccola dei profitti derivanti dalla costruzione di questi sistemi “.
I coautori riscontrano disuguaglianze anche nei laboratori di ricerca sull’intelligenza artificiale istituiti da giganti della tecnologia come Google, Microsoft, Facebook e altri. Nonostante la presenza di questi centri in tutto il Sud e in America Latina, tendono a concentrarsi in alcuni paesi, in particolare India, Brasile, Ghana e Kenya. E le posizioni lì spesso richiedono competenze tecniche che la popolazione locale potrebbe non avere, come illustrato dalla tendenza dei ricercatori e professionisti di IA a lavorare e studiare in luoghi al di fuori dei loro paesi d’origine. I coautori citano un recente rapporto del Center for Security and Emerging Technologies della Georgetown University che ha rilevato che mentre 42 dei 62 principali laboratori di intelligenza artificiale si trovano al di fuori degli Stati Uniti, il 68% del personale si trova negli Stati Uniti.
“Anche con investimenti a lungo termine nelle regioni del Sud del mondo, resta la questione se ai residenti locali vengano fornite opportunità di unirsi al management e contribuire a importanti decisioni strategiche”, hanno scritto i coautori. “La vera inclusione richiede che le voci sottorappresentate possano essere trovate in tutti i ranghi della gerarchia di un’azienda, comprese le posizioni di alta dirigenza. Le aziende tecnologiche che stanno stabilendo un’impronta in queste regioni sono in una posizione unica per offrire questa opportunità ai nativi della regione “.
I coautori sono incoraggiati dagli sforzi di organizzazioni come Khipu e Black in AI , che hanno identificato studenti, ricercatori e professionisti nel campo dell’IA e hanno apportato miglioramenti per aumentare il numero di studiosi latinoamericani e neri che partecipano e pubblicano alle principali conferenze sull’IA . Altre comunità con sede nel continente africano , come Data Science Africa , Masakhane e Deep Learning Indaba , hanno ampliato i loro sforzi con conferenze, workshop e premi per tesi di laurea e sviluppato curricula per la più ampia comunità di IA africana.
Ma stando così le cose, i coautori affermano che una componente chiave dei futuri sforzi di inclusione dovrebbe essere quella di elevare il coinvolgimento e la partecipazione di coloro che storicamente sono esclusi dallo sviluppo dell’IA. Attualmente, sostengono, gli etichettatori di dati sono spesso del tutto distaccati dal resto della pipeline di apprendimento automatico, con i lavoratori che spesso non sanno come verrà utilizzato il loro lavoro né per quale scopo. I coautori affermano che a questi lavoratori dovrebbero essere fornite opportunità di istruzione che consentano loro di contribuire ai modelli che stanno costruendo in modi che vanno oltre l’etichettatura.
“Poco senso di appagamento deriva da compiti umili [come l’etichettatura] e sfruttando questi lavoratori esclusivamente per la loro conoscenza prodotta senza portarli nella piega del prodotto che stanno contribuendo a creare, esiste un abisso profondo tra i lavoratori e il prodotto a valle “, Hanno scritto i coautori. “Allo stesso modo, laddove la partecipazione sotto forma di sviluppo di modelli è la norma, i datori di lavoro dovrebbero cercare di coinvolgere i residenti locali nei ranghi della direzione e nel processo decisionale strategico”.
Pur riconoscendo che non è un compito facile, i coautori suggeriscono di abbracciare lo sviluppo dell’IA come un percorso verso lo sviluppo economico. Piuttosto che fare affidamento sulla leadership straniera dei sistemi di intelligenza artificiale per applicazioni domestiche, dove i rendimenti di questi sistemi spesso non vengono reinvestiti a livello nazionale, incoraggiano i paesi a creare attività di sviluppo di intelligenza artificiale nazionali incentrate su attività “ad alta produttività” come lo sviluppo di modelli, la distribuzione e la ricerca .
“Poiché lo sviluppo dell’IA continua a progredire in tutto il mondo, l’esclusione di coloro che hanno maggiori probabilità di sopportare il peso della disuguaglianza algoritmica non fa che peggiorare”, hanno scritto i coautori. “Ci auguriamo che le azioni che proponiamo possano aiutare a iniziare il movimento delle comunità nel Sud del mondo da semplici beneficiari o soggetti di sistemi di IA a partecipanti attivi e impegnati. Avere una vera agenzia sui sistemi di intelligenza artificiale integrati nei mezzi di sussistenza delle comunità nel Sud del mondo massimizzerà l’impatto di questi sistemi e aprirà la strada all’inclusione globale dell’IA “.