Molti mesi fa, Alexa, l’assistente vocale di Amazon, era stata dichiarata morta a causa delle perdite operative che avevano costretto la società a disattivarla. Tuttavia, sembra che la marea stia cambiando, grazie alla partnership annunciata tra HuggingFace e AWS, che potrebbe portare ad un miglioramento dell’esperienza degli utenti con Alexa.
Amazon ha anche assunto specialisti in AI per migliorare le capacità di dialogo e di recupero di informazioni di Alexa, e il successo dei modelli “text-to-anything” come ChatGPT fa pensare che il prossimo passo sia l’introduzione di reti neurali multimodali.
La visione “multimodale” è stata definita da Rohit Prasad, capo di Alexa di Amazon, come “intelligenza ambientale”, e la società si sta concentrando sul miglioramento della capacità di elaborazione di Alexa per comprendere diversi segnali sensoriali, tra cui immagini, tocco, ultrasuoni e parlato.
Inoltre, i ricercatori di Amazon Alexa AI hanno dimostrato che modelli con meno parametri possono essere altrettanto efficaci, e stanno lavorando per creare un nuovo paradigma di “intelligenza generalizzabile”, in cui i modelli saranno in grado di apprendere nuovi concetti e trasferire la conoscenza tra lingue o attività diverse con poco o nessun input umano.
Il modello generativo da 20 miliardi di parametri chiamato “AlexaTM 20B” sviluppato dai ricercatori di Alexa AI si basa sul codificatore-decodificatore sequenza-sequenza (seq2seq), utilizzando la codifica bidirezionale per rappresentare un testo di input. Questo modello potrà generalizzare compiti diversi e apprendere nuovi compiti solo da una manciata di esempi, superando persino il modello GPT-3 di 175 miliardi di parametri.
Alexa è stata in grado di portare alcuni casi d’uso incrementali a “Echo”, che erano una selezione di attività quotidiane di base ma essenziali come impostare i timer della cucina, riprodurre musica, controllare il tempo e così via. Ciò ha permesso ad Amazon di raddoppiare il successo iniziale di Alexa, piuttosto che seguire la tendenza generale di creare un “chatbot generalizzato”.
La divisione di Alexa di Amazon aveva accumulato una perdita operativa di $10 miliardi nel 2022, ma l’IA generativa potrebbe essere ciò di cui Amazon ha bisogno per incoraggiare le persone a utilizzare di più il dispositivo per tutti i tipi di attività quotidiane.