Determinazione della portata della videosorveglianza tramite i dati di Google Street View
La copertura continua di Google Street View delle arterie stradali del mondo rappresenta forse la registrazione visiva più completa, coerente e coerente della società globale, ad eccezione dei paesi che impongono divieti ai veicoli itineranti di raccolta dati del gigante della ricerca.
In qualità di contributore che genera entrate per l’infrastruttura di Google Maps, il panopticon di Google Street View è una ricca cucitura di dati per l’ analisi dell’apprendimento automatico . Oltre alla sua propensione a catturare inconsapevolmente atti criminali , è stato utilizzato per stimare il reddito regionale dalla qualità delle auto nelle immagini di Google Street View, valutare il verde negli ambienti urbani, identificare i pali , classificare gli edifici e stimare la composizione demografica dei quartieri statunitensi, tante altre iniziative.
Statistiche limitate sulla diffusione delle telecamere di sorveglianza negli Stati Uniti
Nonostante l’ampio utilizzo dei dati di Google Maps per iniziative di machine learning socialmente consapevoli, ci sono pochissimi set di dati basati su Street View che includono esempi etichettati di telecamere di sorveglianza. Il set di dati Mapillary Vistas è tra il piccolo numero disponibile che offre questa funzionalità, sebbene includa meno di 20 videocamere pubbliche etichettate negli Stati Uniti.
La maggior parte delle infrastrutture di videosorveglianza negli Stati Uniti interseca lo Stato solo quando le autorità richiedono filmati di conferma dopo incidenti locali che potrebbero essere stati registrati. Al di là delle normative sulla zonizzazione e nel contesto delle leggi sulla privacy permissive che fanno poco per affrontare la sorveglianza privata degli spazi pubblici, non esiste un quadro amministrativo federale che possa fornire statistiche concrete sul numero di telecamere rivolte al pubblico negli Stati Uniti.
Dati aneddotici e sondaggi limitati sostengono che la diffusione delle videocamere negli Stati Uniti potrebbe essere alla pari con la Cina , ma non è facile da dimostrare.
Identificazione delle videocamere nelle immagini di Google Street View
Considerando questa carenza di dati disponibili, i ricercatori della Stanford University hanno condotto uno studio sulla prevalenza, frequenza e distribuzione delle videocamere rivolte al pubblico che possono essere identificate nelle immagini di Google Street View.
I ricercatori hanno creato un framework di rilevamento delle telecamere che ha valutato 1,6 milioni di immagini di Google Street View in 10 grandi città degli Stati Uniti e in altre sei grandi città in Asia ed Europa.
In ordine decrescente di densità delle telecamere, Boston è in cima alla lista delle città statunitensi esaminate nella ricerca, con una densità recente o attuale di 0,63 e un numero totale di telecamere a 1.600. Nonostante ciò, New York City ha molte più telecamere (10.100) sparse su un’area più ampia. Fonte: https://arxiv.org/pdf/2105.01764.pdf
Tra le città degli Stati Uniti, Boston ha la più alta densità di telecamere identificate, mentre New York City ha il maggior numero di telecamere a 10.100, distribuite su una distanza maggiore. In Asia, Tokyo ha un numero enorme di 21.700 telecamere stimate, ma Seoul ha un numero inferiore di telecamere (13.900) concentrate molto più densamente. Sebbene siano state identificate 13.000 telecamere per le immagini di Street View di Londra, Parigi batte questo sia in termini di posizionamenti identificati (13,00) che di densità di copertura.
I ricercatori osservano che la densità delle telecamere varia notevolmente tra i quartieri e le zone delle città.
Tra gli altri fattori limitanti per l’accuratezza del rilievo (a cui arriveremo), i ricercatori osservano che le telecamere nelle aree residenziali sono tre volte più difficili da identificare rispetto a quelle collocate in parchi pubblici, aree industriali e zone a uso misto – presumibilmente perché l’effetto “deterrente” è sempre più discutibile o controverso nelle zone residenziali, rendendo più probabili i posizionamenti mimetizzati o discreti.
Prendendo in considerazione le città studiate in Europa e in Asia, Seoul occupa il primo posto come ambiente urbano più sorvegliato, con Parigi non molto indietro.
Laddove una zona ha una maggioranza definita dal censimento di residenti etnici o appartenenti a minoranze, la frequenza dei posizionamenti delle telecamere aumenta notevolmente, anche con tutti i fattori attenuanti presi in considerazione dai ricercatori di Stanford.
La frequenza delle telecamere di sorveglianza aumenta in proporzione diretta all’aumento dei dati demografici delle minoranze in un quartiere, secondo la ricerca di Stanford.
La ricerca è stata condotta in due periodi di tempo, 2011-2015 e 2016-2020. Sebbene i dati mostrino una crescita costante e talvolta aberrante del posizionamento delle telecamere di sorveglianza nel periodo di nove anni, i ricercatori suggeriscono che questa proliferazione di telecamere di sorveglianza potrebbe aver raggiunto un “plateau temporaneo”.
Metodologia
I ricercatori hanno inizialmente compilato due set di dati delle immagini di Street View, uno dei quali non presentava il posizionamento delle videocamere, e hanno generato maschere di segmentazione per questi. Un modello di segmentazione è stato addestrato su questi set di dati rispetto a un set di dati di convalida (di San Francisco – vedere “Fattori limitanti” di seguito).
Quindi il modello di output è stato eseguito su immagini di Street View casuali, con tutti i rilevamenti positivi delle telecamere confermati dagli esseri umani e i falsi positivi rimossi.
A sinistra, l’immagine grezza di Google Street View. Successivamente, la maschera di segmentazione adattata. Terzo, un’identificazione della telecamera derivata dall’algoritmo. Esatto, un posizionamento verificato dall’uomo.
Infine, il framework ha calcolato il campo visivo degli angoli di ripresa coinvolti al fine di stimare l’estensione della copertura, confrontata con le impronte degli edifici coinvolti e le specifiche della rete stradale.
Altri dati che hanno contribuito a questa matrice includevano le specifiche degli edifici di OpenStreetMap e l’uso delle mappe del censimento degli Stati Uniti per garantire che lo studio fosse limitato ai confini amministrativi di ogni città. Inoltre, il progetto ha utilizzato i dati sulla posizione della telecamera di San Francisco da uno studio della Electronic Frontier Foundation (EFF), con le immagini di Google Street View accessibili tramite l’ API statica .
I ricercatori hanno stimato la copertura calcolando il campo visivo delle telecamere di Google Street View rispetto ai dati di OpenStreetMap.
Fattori limitanti
I ricercatori ammettono una serie di fattori limitanti che dovrebbero essere considerati durante la revisione dei risultati.
In primo luogo, che le telecamere identificate dal sistema di apprendimento automatico sono state tutte successivamente verificate o negate dalla revisione umana e che questa revisione è un processo fallibile.
In secondo luogo, lo studio era limitato dalla risoluzione disponibile delle immagini di Street View, che limitava i ricercatori a identificare le telecamere posizionate entro trenta metri dal punto di vista. Ciò non significa solo che alcune telecamere potrebbero essere state “ inventate ” con una risoluzione limitata, ma anche che molte al di fuori di questo ambito (come telecamere di alto livello, posizionamenti oscurati e microcamere nei raccordi dei campanelli) potrebbero non essere state identificate.
Infine, la stima del richiamo del modello specifico della città può essere un fattore limitante nell’accuratezza dei risultati, dal momento che la città di San Francisco, dove la frequenza delle telecamere di sorveglianza era già stata etichettata in un lavoro precedente dall’EFF, è stata applicata ad altre giurisdizioni per rendere il studio fattibile.