Supercomputer AI e riconoscimento facciale per verificare l’identità dei contribuenti
Supercomputer e riconoscimento facciale hanno dominato i titoli dei giornali questa settimana nell’IA, ma non necessariamente in egual misura. Meta, la società precedentemente nota come Facebook, ha annunciato che sta costruendo un cluster di server per la ricerca sull’intelligenza artificiale che afferma sarà tra i più veloci del suo genere. Nel frattempo, l’IRS ha implementato silenziosamente un nuovo programma con un fornitore, ID.me, che utilizza controverso la tecnologia di riconoscimento facciale per verificare l’identità dei contribuenti.
Il nuovo “supercomputer AI” di Meta – chiamato AI Research SuperCluster (RSC) – è sicuramente impressionante. I lavori sono iniziati un anno e mezzo fa, con la fase uno che ha raggiunto la fase operativa nelle ultime settimane. Attualmente, RSC dispone di 760 sistemi Nvidia GGX A100 contenenti 6.080 GPU collegate, nonché sistemi di raffreddamento, alimentazione, rete e cablaggio personalizzati. La fase due sarà completata entro il 2022, portando RSC fino a 16.000 GPU totali e la capacità di addestrare sistemi di intelligenza artificiale “su set di dati grandi quanto un exabyte”.
Meta afferma che RSC verrà applicato alla formazione di una gamma di sistemi nelle attività di Meta, inclusi algoritmi di moderazione dei contenuti, funzionalità di realtà aumentata ed esperienze per il metaverso. Ma la società non ha annunciato piani per rendere pubbliche le capacità di RSC, che secondo molti esperti mettono in evidenza le disuguaglianze di risorse nel settore dell’IA.
“Penso che sia importante ricordare che Meta spende soldi per occhiali costosi e grandi perché i soldi sono la loro forza: possono spendere più delle persone e ottenere grandi risultati, i grandi titoli che vogliono in questo modo”, Mike Cook, ricercatore di intelligenza artificiale presso la Queen Mary University a Londra, ha detto a VentureBeat via e-mail. “Spero assolutamente che Meta riesca a fare qualcosa di interessante con questo e che tutti ne traggano vantaggio, ma è davvero importante che inseriamo questo nel contesto: i laboratori privati come [Meta] ridefiniscono i progressi lungo queste linee ristrette in cui eccellono, in modo che possono posizionarsi come leader”.
Non sorprende che le grandi aziende dominano l’elenco dei “supercomputer AI”, visti i costi coinvolti nella costruzione di tali sistemi. Microsoft due anni fa ha annunciato di aver creato un supercomputer AI da 10.000 GPU in esecuzione sulla sua piattaforma Azure con il laboratorio di ricerca OpenAI. Nvidia ha il suo supercomputer interno, Selene, che utilizza per la ricerca sull’IA, inclusa la formazione di modelli di linguaggio naturale e visione artificiale.
Os Keyes, un esperto di intelligenza artificiale presso l’Università di Washington, ha definito la tendenza “preoccupante”. Keyes afferma che la direzione di un’infrastruttura di calcolo AI più ampia e più costosa premia erroneamente “scala ed egemonia”, mentre si blocca in “forme organizzative monolitiche” come il modo logico o efficiente di fare le cose.
“Dice alcune cose interessanti su Meta – su dove sta scegliendo di concentrare gli sforzi”, ha detto Keyes. “Il fatto che la direzione di investimento di Meta sia nei sistemi algoritmici dimostra esattamente quanto si siano legati al ‘tecnosoluzionismo’… È un cambiamento guidato da ciò che impressiona gli azionisti e ciò che impressiona l'”ideologia della California’, e questo non è affatto un cambiamento.”
Aiden Gomez, CEO di Cohere, una startup che sviluppa modelli linguistici di grandi dimensioni per una vasta gamma di casi d’uso, ha definito RSC un “risultato importante”. Ma ha sottolineato che è “un’altra prova che solo le organizzazioni più grandi sono in grado di sviluppare e trarre vantaggio da questa tecnologia”. Sebbene i modelli linguistici in particolare siano diventati più accessibili negli ultimi anni, grazie a sforzi come BigScience ed EleutherAI di Hugging Face , i sistemi di intelligenza artificiale all’avanguardia rimangono costosi da addestrare e implementare. Ad esempio, modelli linguistici di formazione come Megatron 530B di Nvidia e Microsoft possono costare fino a milioni di dollari, senza tenere conto delle spese di archiviazione. L’inferenza, che in realtà esegue il modello addestrato, è un’altra barriera. Una stima fissa il costo di esecuzione di GPT-3 su una singola istanza di Amazon Web Services a un minimo di $ 87.000 all’anno.
“La grande spinta per noi di Cohere è cambiare questo e ampliare l’accesso ai risultati dei potenti progressi dei supercomputer – modelli linguistici di grandi dimensioni – attraverso una piattaforma conveniente”, ha affermato Gomez. “In definitiva, vogliamo evitare la situazione estremamente dispendiosa in termini di risorse in cui tutti devono costruire il proprio supercomputer per ottenere l’accesso a un’IA di alta qualità”.
Riconoscimento facciale per le tasse
In altre notizie, l’IRS quest’anno ha annunciato che sta stipulando un contratto con ID.me, una società di riconoscimento facciale con sede a Virginia, per verificare l’identità dei contribuenti online. Come riportato da Gizmodo, gli utenti con un account IRS.gov dovranno fornire un documento d’identità governativo, un selfie e copie delle loro bollette a partire da questa estate per svolgere determinate attività, come ottenere una trascrizione online (ma non per archiviare le tasse).
L’IRS propone le nuove misure come un modo per “proteggere la sicurezza dei contribuenti”. Ma ID.me ha una storia problematica, come dimostrano le denunce di residenti nei circa 30 stati che hanno stipulato un contratto con l’azienda per la verifica dell’indennità di disoccupazione.
A New York, News10NBC descrive in dettaglio i residenti che lottano per navigare attraverso il sistema di ID.me, inclusa una donna che ha affermato di aver aspettato 19 settimane per i suoi benefici. Alcuni hanno suggerito che le persone di colore hanno maggiori probabilità di essere erroneamente identificate dal sistema, il che non sarebbe né sorprendente né senza precedenti. I pregiudizi di genere e razziali sono un fenomeno ben documentato negli algoritmi di analisi facciale , attribuibile a squilibri nei set di dati utilizzati per addestrare gli algoritmi. In uno studio del 2020 , i ricercatori hanno dimostrato che gli algoritmi potrebbero persino diventare prevenuti verso le espressioni facciali, come sorridere o abiti diversi, il che potrebbe ridurre la loro precisione di riconoscimento.
Preoccupante, ID.me non è stato del tutto onesto sulle capacità della sua tecnologia. Contrariamente ad alcune dichiarazioni pubbliche di ID.me, la società confronta i volti con un database di grandi dimensioni: una pratica che i sostenitori della privacy temono rappresentano un rischio per la sicurezza e potrebbe portare a “missioni striscianti” da parte delle agenzie governative.
“Questo espande notevolmente il rischio di pregiudizi razziali e di genere sulla piattaforma”, ha detto a Gizmodo il direttore esecutivo del Surveillance Technology Oversight Project Albert Fox Cahn. “Più fondamentalmente, dobbiamo chiederci perché gli americani dovrebbero affidare a questa azienda i nostri dati se non sono onesti su come vengono utilizzati i nostri dati. L’IRS non dovrebbe dare a nessuna azienda così tanto potere per decidere come vengono archiviati i nostri dati biometrici”.