Come l’Intelligenza Artificiale sta migliorando il web per i non vedenti

Ci sono quasi 350 milioni di persone in tutto il mondo con cecità o qualche altra forma di disabilità visiva che hanno bisogno di usare Internet e le app mobili come chiunque altro. Tuttavia, possono farlo solo se i siti Web e le app mobili sono creati pensando all’accessibilità, e non come un ripensamento .

Il problema
Considera questi due pulsanti di esempio che potresti trovare su una pagina Web o un’app mobile. Ognuno ha uno sfondo semplice, quindi sembrano simili.

In effetti, sono un mondo a parte quando si tratta di accessibilità.

È una questione di contrasto. Il testo sul pulsante azzurro ha un contrasto basso, quindi per qualcuno con problemi di vista come daltonismo o malattia di Stargardt, la parola “Ciao” potrebbe essere completamente invisibile. Si scopre che esiste una formula matematica standard che definisce la corretta relazione tra il colore del testo e il suo sfondo. I bravi designer lo sanno e usano i calcolatori online per calcolare quei rapporti per qualsiasi elemento in un progetto.

Fin qui tutto bene. Ma quando si tratta di testo su uno sfondo complesso come un’immagine o una sfumatura, le cose iniziano a complicarsi e gli strumenti utili sono rari. Prima di oggi, i tester di accessibilità hanno dovuto controllare questi casi manualmente campionando lo sfondo del testo in determinati punti e calcolando il rapporto di contrasto per ciascuno dei campioni. Oltre ad essere laboriosa, la misurazione è anche intrinsecamente soggettiva, poiché diversi tester potrebbero campionare punti diversi all’interno della stessa area e ottenere misurazioni diverse. Questo problema – misurazioni laboriose e soggettive – ha frenato gli sforzi per l’accessibilità digitale per anni.

Accessibilità: AI in soccorso
Si scopre che gli algoritmi di intelligenza artificiale possono essere addestrati per risolvere problemi come questo e persino per migliorare automaticamente man mano che vengono esposti a più dati.

Ad esempio, l’IA può essere addestrata per eseguire il riepilogo del testo, il che è utile per gli utenti con disabilità cognitive; o per fare il riconoscimento di immagini e facciali, che aiuta le persone con disabilità visive; o sottotitoli in tempo reale, che aiutano le persone con problemi di udito. L’integrazione di VoiceOver di Apple su iPhone, il cui utilizzo principale è pronunciare e-mail o messaggi di testo, utilizza anche l’intelligenza artificiale per descrivere le icone delle app e segnalare i livelli della batteria.

Principi guida per l’accessibilità
Le aziende sagge si stanno affrettando a conformarsi all’Americans with Disabilities Act (ADA) e a dare a tutti uguale accesso alla tecnologia. In base alla nostra esperienza, gli strumenti tecnologici giusti possono contribuire a renderlo molto più semplice, anche per i moderni siti Web di oggi con le loro migliaia di componenti. Ad esempio, il design di un sito può essere scansionato e analizzato tramite l’apprendimento automatico. Può quindi migliorare la sua accessibilità attraverso il riconoscimento facciale e vocale, la navigazione da tastiera, la traduzione audio delle descrizioni e persino il riadattamento dinamico degli elementi dell’immagine.

Nel nostro lavoro abbiamo individuato tre principi guida che, a mio avviso, sono fondamentali per l’accessibilità digitale. Li illustrerò qui facendo riferimento a come il nostro team, in uno sforzo guidato dal nostro team leader di data science Asya Frumkin, ha risolto il problema del testo su sfondi complessi.

Esempio di sfondi complessi. Immagine dell’autore
Dividi il grande problema in problemi più piccoli
Se osserviamo il testo nell’immagine qui sotto, vediamo che c’è una sorta di problema di leggibilità, ma è difficile quantificare nel complesso, guardando solo all’intera frase. D’altra parte, se il nostro algoritmo esamina separatamente ciascuna delle lettere della frase – ad esempio la “e” a sinistra e la “o” a destra – possiamo più facilmente dire per ciascuna di esse se è leggibile o no.

Se il nostro algoritmo continua a esaminare tutti i caratteri del testo in questo modo, possiamo contare il numero di caratteri leggibili nel testo e il numero totale di caratteri. Nel nostro caso, ci sono quattro caratteri leggibili su otto in totale. La frazione che ne segue, con il numero di caratteri leggibili come numeratore, ci fornisce un rapporto di leggibilità per il testo complessivo. Possiamo quindi utilizzare una soglia prestabilita concordata, ad esempio 0,6, al di sotto della quale il testo è considerato illeggibile. Ma il punto è che ci siamo arrivati eseguendo operazioni su ogni parte del testo e poi contando da lì.

Esempio di soluzione in background complessa. Immagine dell’autore
Riutilizzare gli strumenti esistenti ove possibile
Ricordiamo tutti il riconoscimento ottico dei caratteri (“OCR”) degli anni ’70 e ’80. Quegli strumenti erano promettenti ma alla fine erano troppo complessi per lo scopo originariamente previsto.

Ma c’era una parte di quegli strumenti chiamato modello The CRAFT (Character-Region Awareness For Text) che ha tenuto fede all’intelligenza artificiale e all’accessibilità. CRAFT associa ogni pixel dell’immagine alla sua probabilità di trovarsi al centro di una lettera. Sulla base di questo calcolo, è possibile produrre una mappa termica in cui le aree ad alta probabilità verranno dipinte in rosso e le aree a bassa probabilità verranno dipinte in blu. Da questa mappa termica, puoi calcolare i riquadri di delimitazione dei personaggi e ritagliarli dall’immagine. Usando questo strumento, possiamo estrarre singoli caratteri da un testo lungo ed eseguire un modello di classificazione binaria (come in n. 1 sopra) su ciascuno di essi.

Trova il giusto equilibrio nel set di dati
Il modello del problema classifica i singoli caratteri in modo binario, almeno in teoria. In pratica, ci saranno sempre esempi difficili da quantificare nel mondo reale. Ciò che complica ancora di più la questione è il fatto che ogni persona, ipovedente o meno, ha una diversa percezione di ciò che è leggibile.

Qui, una soluzione (e quella che abbiamo adottato) consiste nell’arricchire il set di dati aggiungendo tag obiettivo a ciascun elemento. Ad esempio, ogni immagine può essere timbrata con un testo di riferimento su uno sfondo fisso prima dell’analisi. In questo modo, quando l’algoritmo viene eseguito, avrà una base oggettiva per il confronto.

Per il futuro, per il bene superiore
Poiché il mondo continua ad evolversi, ogni sito Web e applicazione mobile deve essere creato tenendo conto dell’accessibilità fin dall’inizio. L’intelligenza artificiale per l’accessibilità è una capacità tecnologica, un’opportunità per uscire dai margini e impegnarsi e un’opportunità per costruire un mondo in cui le difficoltà delle persone siano comprese e considerate. A nostro avviso, la soluzione alla tecnologia inaccessibile è semplicemente una tecnologia migliore. In questo modo, rendere accessibili siti Web e app è parte integrante della creazione di siti Web e app che funzionano, ma questa volta per tutti.

Come l’Intelligenza Artificiale sta migliorando il web per i non vedenti

Diihal

Di ihal

Articoli correlati

Il rinascimento digitale del Kung Fu: come la Cina riporta in vita i classici con l’AI

Arch-Router: il nuovo modello di routing per ottimizzare l’assegnazione dei compiti tra LLM

Isomorphic Labs, l’AI di Google DeepMind entra nelle sperimentazioni cliniche

You missed

Il rinascimento digitale del Kung Fu: come la Cina riporta in vita i classici con l’AI

Grok arriva sulle Tesla: l’intelligenza artificiale di Elon Musk si integra nelle auto

Lavawave lancia SCAM GUARD, AI per contrastare i crimini digitali

Google Gemini introduce la funzione di generazione video da foto con Veo 3