Stima del vero stato di povertà globale con il machine learning
Mappa della povertà attraverso l’apprendimento automatico
Una collaborazione di UoC Berkeley, Stanford University e Facebook offre un quadro più approfondito e granulare dell’attuale stato di povertà in e attraverso le nazioni, attraverso l’uso dell’apprendimento automatico .
La ricerca , intitolata Micro-Estimates of Wealth for all Low-and Middle-Income Countries , è accompagnata da un sito web beta che consente agli utenti di esplorare in modo interattivo lo stato economico assoluto e relativo di aree a grana fine e sacche di povertà a basso e medio paesi a reddito.
Mappa interattiva della povertà nel mondo attraverso l’apprendimento automatico
Il framework incorpora dati da immagini satellitari, mappe topografiche, reti di telefonia mobile e dati aggregati anonimi da Facebook, ed è verificato in base a ampi sondaggi faccia a faccia, allo scopo di riportare disparità di ricchezza relativa in una regione, piuttosto che stime assolute di reddito .
Il sistema è stato adottato dal governo della Nigeria come base per la gestione dei programmi di protezione sociale e funziona in tandem con il quadro esistente della Banca Mondiale, il National Social Safety Nets Project ( NASSP ). A febbraio ai primi beneficiari del regime è stato versato un trasferimento in contanti di 5000 naira nigeriane, una prestazione pagabile fino a sei mesi, fino al raggiungimento della soglia di un milione di naira.
Il documento afferma che la povertà dei dati fornisce un notevole contributo alla distribuzione errata degli aiuti in paesi con risorse minime per la raccolta di dati o infrastrutture limitate, e che anche un fattore di segnalazione errata politicamente motivato (un problema non limitato ai paesi a basso reddito) .
Registrazione dei “poveri non segnalati”
Le simulazioni dei ricercatori sui dati hanno dimostrato che, in base alle normative esistenti per l’allocazione delle risorse di aiuto, la distribuzione basata su questo sistema aumenta i pagamenti ai più bisognosi e diminuisce i pagamenti per i beneficiari esistenti nelle fasce di reddito più elevate. Il documento rileva inoltre la difficoltà incontrata dagli amministratori dei programmi di protezione sociale nell’allocazione delle risorse per gli aiuti all’inizio della crisi COVID-19, a causa della mancanza di dati completi o dettagliati. In Nigeria, ad esempio, i dati dell’indagine più recenti riguardano le famiglie in appena il 13,8% di tutti i distretti nigeriani, rispetto alla copertura del 100% offerta dal nuovo schema.
Il lavoro precedente nella stima della povertà assistita dall’intelligenza artificiale si è concentrato in gran parte sui dati ottenuti dal satellite (vedi sotto), ma i ricercatori affermano che i dati dalla connettività mobile ottengono una visione più accurata e granulare della disparità di ricchezza tra le regioni e questo flusso di informazioni fornisce la metà del tutti i dati che contribuiscono al progetto.
Dal punto di vista della generalizzazione dei dati di apprendimento automatico, i ricercatori osservano che i modelli addestrati in un paese possono essere un modello utile e accurato per i modelli che coprono paesi adiacenti. Notano anche che il nuovo quadro è in grado non solo di distinguere tra aree urbane e rurali, ma è in grado di fornire mappe delle disparità all’interno delle aree urbanizzate, il che supera la portata di molte recenti iniziative di ricerca in questo settore.
Immagini satellitari nell’analisi della povertà
Il principio alla base dell’analisi della povertà basata su satellite è la presunzione che i poveri abbiano pochi soldi per accendere le luci elettriche nell’ora dell’oscurità, o potrebbero non avere alcun impianto di illuminazione elettrica. Laddove l’assenza di punti luce possa essere correlata alla presenza di persone, come accertato con altri mezzi (come i dati di connettività mobile), si può generare un indice di deprivazione.
Questa tecnica è stata proposta nel 2016 in un precedente documento di Stanford di un altro gruppo di ricerca. Il metodo descritto in quel documento ha aperto la strada all’uso della copertura satellitare serale fornita dal programma satellitare meteorologico della difesa dell’aeronautica degli Stati Uniti ( DMSP ) tramite la National Oceanic and Atmospheric Administration (NOAA-NGDC).
Il progetto Stanford ha correlato le prove filtrate delle luci notturne nella sorveglianza satellitare con il proprio database di indagini DHS per l’anno in cui si sono verificate sia le indagini che i risultati satellitari aggregati. È stato necessario stabilire le medie della somma dei valori di luce notturna come proxy per alcuni indicatori economici.
Verità fondamentale per le statistiche sulla povertà globale
Per il nuovo progetto Stanford, i ricercatori hanno deciso di derivare la struttura dei dati dal programma DHS (Demographic and Health Survey ) esistente , anche se, come ammettono, questo replica efficacemente lo schema DHS nel set di dati. I ricercatori osservano: “Abbiamo scelto di addestrare il nostro modello esclusivamente sui dati DHS perché è la singola fonte più completa di dati sulla ricchezza disponibili pubblicamente e standardizzati a livello internazionale che fornisce stime della ricchezza a livello familiare con geo-marker subregionali”.
Tuttavia, il progetto opera a una risoluzione molto più elevata rispetto al DHS e l’utilizzo del framework esistente come verità di base offre due vantaggi: in primo luogo, i dati del DHS non si basano sulla rendicontazione formale del reddito, che è un indicatore inaffidabile nei paesi più colpiti da povertà, dove le economie del mercato nero sono diffuse; in secondo luogo, i dati vengono raccolti in modo standardizzato e secondo un modello internazionale che consente al quadro dei ricercatori di comprendere altri paesi soggetti a questo metodo di misurazione, piuttosto che stabilire equivalenze tra quadri concorrenti.
Connettività mobile come indice economico
Per le persone che vivono in aree economicamente difficili, la connettività mobile è diventata un’ancora di salvezza tecnologica negli ultimi due decenni, poiché i telefoni cellulari sono la piattaforma tecnologica minima disponibile su cui fare affidamento in tali condizioni. I telefoni cellulari sono diventati de facto anche piattaforme di pagamento per i beneficiari di aiuti che non dispongono di un conto bancario o di altri mezzi convenzionali per ricevere denaro.
Tuttavia, come è stato osservato in precedenza , l’utilizzo di indicatori di rete mobile come indice economico per i sistemi di machine learning presenta alcuni potenziali inconvenienti: ci sono persone nelle regioni colpite che sono così povere da non possedere nemmeno un telefono cellulare – le stesse persone che il il sistema è più progettato per aiutare; il sistema potrebbe essere potenzialmente manipolato da utenti con più telefoni cellulari in circostanze in cui un telefono è diventato un proxy per hash ID univoci dei cittadini; e ci sono implicazioni per la privacy nella creazione di questo tipo di sistema di identificazione, nei casi in cui il governo locale o nazionale mantiene una certa supervisione del progetto.