Gabriel, un ingegnere informatico, ha salutato con entusiasmo Yuanqing Yang, presidente e CEO di Lenovo, durante l’evento Tech World. Il saluto è avvenuto in Lingua dei Segni Brasiliana (Libras), nonostante Yang non fosse familiare con essa. Tuttavia, grazie all’intelligenza artificiale, era a conoscenza di Gabriel. Un sistema innovativo di intelligenza artificiale ha tradotto il discorso e il testo di Gabriel in tempo reale mentre una telecamera ha registrato ogni movimento. Nonostante la differenza linguistica, Gabriel e Yang sono riusciti a stabilire una connessione immediata e autentica.
Durante questo incontro, è stata presentata un’innovativa soluzione di accessibilità sviluppata da ricercatori Lenovo. In Brasile, dove ci sono circa 2,3 milioni di persone con problemi uditivi, questa tecnologia ha il potenziale per migliorare la loro vita in molteplici modi. La soluzione di intelligenza artificiale del team di ricerca e sviluppo può facilitare la comunicazione e la costruzione di relazioni anche in assenza di un interprete di lingua dei segni, sia in ospedali che in punti vendita al dettaglio.
Durante l’evento Tech World, i server edge Lenovo hanno sostenuto l’intelligenza artificiale e gestito i dati raccolti mentre Gabriel si esprimeva. Questi server offrono velocità e affidabilità superiori in ambito di intelligenza artificiale rispetto al cloud computing. Anche se la voce generata dall’intelligenza artificiale di Gabriel era principalmente una dimostrazione concettuale, la tecnologia dietro di essa era già ben sviluppata e pronta all’uso. Inoltre, molte ore di dati video anonimi sono state donate per migliorare l’intelligenza artificiale, provenienti da persone con problemi uditivi che utilizzano Libras.
Un programmatore che parla fluentemente Libras ha sollevato questioni di accessibilità durante una discussione interna nel team di Lenovo nel 2019. Questo ha spinto il team brasiliano di Lenovo a cercare soluzioni, inclusa un’app di chat che traduce Libras in portoghese scritto o parlato in tempo reale. L’intelligenza artificiale generativa e i set di dati multilingue hanno reso possibile la traduzione in diverse lingue.
Una delle sfide principali riguardava l’acquisizione e la traduzione dei video in tempo reale, data la grande quantità di dati coinvolti, inclusi movimenti e stili specifici della Lingua dei Segni. Lenovo ha collaborato con CESAR, un hub di innovazione brasiliano, per affrontare questa sfida, scambiando conoscenze e producendo una vasta libreria di film in Libras per addestrare gli algoritmi.
L’intelligenza artificiale elabora i movimenti e i gesti del firmatario, traducendo quindi il linguaggio dei segni in testo. Il team ha lavorato con il Product Diversity Office di Lenovo per garantire che il prodotto fosse accessibile a persone con diversi tipi di disabilità.
La tecnologia ha il potenziale per accelerare l’apprendimento della lingua dei segni monitorando la precisione dei gesti e fornendo feedback agli utenti. Inoltre, la collaborazione con Infrastructure Solutions Group di Lenovo ha portato allo sviluppo di un sistema che consente ai clienti di accedere all’intelligenza artificiale direttamente dalla fonte dei dati.
Il prossimo passo prevede l’espansione del progetto per fornire un’interfaccia di traduzione in lingua dei segni su larga scala, con ulteriori dati e algoritmi di autoapprendimento. Questo potrebbe portare a soluzioni personalizzate per settori verticali specifici, contribuendo a rendere le tecnologie più inclusive per le persone non udenti e con problemi uditivi in tutto il mondo.