Con un feedback esplicito, l’IA ha bisogno di meno dati di quanto pensi

Abbiamo tutti capito che l’intelligenza artificiale e l’apprendimento automatico sono la salsa magica che alimenta le proprietà Internet dei consumatori su larga scala. Facebook, Amazon e Instacart vantano enormi set di dati e un enorme numero di utenti. La saggezza comune suggerisce che questo vantaggio di scala è un potente fossato competitivo; consente una migliore personalizzazione, consigli e, in definitiva, una migliore esperienza utente. In questo articolo, ti mostrerò che questo fossato è meno profondo di quanto sembri; e che approcci alternativi alla personalizzazione possono produrre risultati eccezionali senza fare affidamento su miliardi di punti dati. 

La maggior parte dei dati degli utenti odierni proviene da comportamenti impliciti
In che modo Instagram e TikTok capiscono cosa ti piace e cosa non ti piace? Certo, ci sono segnali espliciti: Mi piace e commenti. Ma la stragrande maggioranza delle tue interazioni non sono quelle; è il tuo comportamento di scorrimento, i clic “leggi di più” e le interazioni video. Gli utenti consumano molti più contenuti di quanti ne producono ; i fattori chiave che le piattaforme di social media utilizzano per determinare cosa ti è piaciuto e cosa non ti è piaciuto si basano su questi segnali. Hai riattivato quel video di Instagram e l’hai guardato per ben 30 secondi? Instagram può dedurre che sei interessato. L’hai superato per saltare? Va bene, non così tanto. 

 
Storie vere dal Lumen Edge: come le reti ad alte prestazioni stanno accelerando l’innovazione nei settori dell’hardware, del software e dei servizi
Ecco una domanda chiave, però: Instagram sa perché hai riattivato il video di quel gatto su una moto ? Naturalmente, non lo fanno: hanno solo osservato il comportamento, ma non il perché dietro di esso. Potrebbe essere che tu abbia visto un volto familiare nel primo fotogramma e volevi vederne di più. O perché ti piacciono le moto. O nei gatti. Oppure hai cliccato accidentalmente. Non possono sapere a causa della struttura dell’esperienza utente e delle aspettative del cliente. In quanto tale, per capire se erano i gatti, o le motociclette, o qualcosa del tutto estraneo, hanno bisogno di osservare molto di più i tuoi comportamenti. Ti mostreranno video di motociclette e, separatamente, video di gatti, e questo può aiutare ad aumentare la loro sicurezza un po’ di più. 

Per aggiungere a questo problema, la piattaforma non rileva solo “gatti” e “motociclette” in questo video: ci sono dozzine, se non centinaia, di funzionalità che potrebbero spiegare perché eri interessato. Se non c’è una tassonomia che definisca bene lo spazio, un approccio di deep learning che non richiede una tassonomia (cioè la definizione delle caratteristiche) necessita di ordini di grandezza in più di dati. 

 

Puoi vedere quanto sia fragile e affamato di dati questo approccio, tutto perché si basa su un’inferenza comportamentale implicita. 

Valutiamo un approccio alternativo per comprendere l’intento dell’utente con un’analogia. Immagina un’interazione sociale in cui la persona A sta mostrando lo stesso video alla persona B. Se la persona B dice semplicemente “è fantastico”, A può dedurre molto sulle preferenze di B? Non tanto. E se invece A intervenisse con “Cosa ti è piaciuto?” Molto si può dedurre dalla risposta a questa domanda. 

Come si può tradurre questa interazione nel mondo delle interazioni uomo-computer? 

Feedback esplicito: chiedi all’utente!
Diamo un’occhiata al ridesharing. Un requisito fondamentale in tale attività è garantire la qualità dei conducenti; un conducente che crea una scarsa esperienza di guida deve essere espulso rapidamente dal sistema, altrimenti possono essere piuttosto dannosi per l’azienda. Così è apparso un modello molto semplice: Uber ha chiesto all’utente di valutare l’autista dopo ogni corsa. Una valutazione inferiore a 4,6 espelle il conducente dal sistema Uber.

 
Eppure, l’assunzione e l’inserimento di autisti è un’impresa costosa; con bonus fino a $ 1.000 per un nuovo conducente Uber, è abbastanza inefficiente licenziare i conducenti per reati che avrebbero potuto facilmente affrontare. 

In un modello basato su una valutazione da una a cinque stelle, un pilota è “sostanzialmente perfetto” o “alla fine licenziato”. Questa mancanza di sfumature è dannosa per gli affari. Cosa succede se un guidatore commette un reato molto risolvibile di mangiare regolarmente nella propria auto e, in quanto tale, la sua auto puzza per alcune ore dopo pranzo? Se solo ci fosse un modo per i motociclisti di indicarlo nel loro feedback e per il conducente ignaro di impararlo…  

Questo è esattamente ciò che Uber ha perseguito nella seconda iterazione del suo sistema di feedback. Ogni volta che un pilota valuta un viaggio con quattro stelle o meno, è tenuto a selezionare un motivo da un elenco a discesa. Uno di questi motivi è “l’odore dell’auto”. Se una manciata di motociclisti – su dozzine di corse che un conducente offre! — fornire un feedback esplicito sull’odore dell’auto, il conducente può essere informato e risolverlo. 

Quali sono le caratteristiche chiave di questo approccio notevolmente più efficiente? 

ANNUNCIO
Tassonomia definita: gli specialisti dell’esperienza del pilota di Uber hanno definito diverse dimensioni dell’esperienza del pilota. Quali sono i motivi per cui un ciclista può essere infelice dopo una corsa? L’odore dell’auto è uno; ce ne sono una mezza dozzina di altri . Questa definizione precisa è possibile perché lo spazio del problema è limitato e ben compreso da Uber. Questi motivi non sarebbero rilevanti per la consegna di cibo o i video di YouTube. Fare le domande giuste è fondamentale. 
Chiedere esplicitamente all’utente il PERCHE’ dietro il feedback: Uber non indovina il motivo per cui hai valutato la corsa con una stella: è stato a causa della vernice scrostata sull’auto o perché l’autista è stato scortese? A differenza di Instagram, che lancerebbe più dati per risolvere il problema, Uber non può esporre alcune dozzine di clienti a un cattivo driver, quindi i vincoli del volume di dati li costringono a essere intelligenti. 
Ci sono esempi meravigliosi in domini diversi dal rideshare. 

Hotels.com chiede informazioni sulla tua esperienza subito dopo il check-in. È un semplice sondaggio e-mail. Dopo aver fatto clic su “ottimo”, chiedono “Cosa ti è piaciuto?” con opzioni come “personale cordiale” e “camera pulita e frizzante”.

 
Hungryroot, l’azienda in cui lavoro, chiede all’utente le sue preferenze alimentari durante la registrazione al fine di facilitare un’alimentazione sana. Vuoi mangiare più verdure? Ti piacciono i cibi piccanti? Preferisci essere senza glutine? Ottimo, dicci in anticipo. I consigli per i tuoi generi alimentari e le tue ricette si baseranno su ciò che ci hai detto. 

Questo approccio è drammaticamente più efficace. Richiede meno dati e l’inferenza guidata da ciascun punto dati può essere molto più forte. Questo approccio, inoltre, non richiede l’osservazione inquietante su ciò su cui l’utente sta facendo clic o scorre oltre, il tipo di ficcanaso per cui i giganti della tecnologia si sono messi nei guai. 

È importante notare un compromesso qui. I meccanismi di feedback impliciti non richiedono alcuno sforzo da parte dell’utente; d’altra parte, andare troppo oltre quando si chiede all’utente un feedback esplicito può creare fastidio. Immagina che Uber stia esagerando con le domande successive: “Qual era esattamente il cattivo odore nell’auto? Quell’odore ti ha infastidito per tutto il viaggio o in parte? Era un odore forte?” Questo passa da utile e premuroso a irritante e sicuramente si ritorcerebbe contro. C’è sicuramente un punto debole da trovare. 

 
I fossati basati su dati utente impliciti sono piuttosto superficiali
Non aver paura di un incumbent con un vantaggio di dati implicito. Costruisci una tassonomia del tuo spazio e chiedi agli utenti un feedback esplicito. I tuoi utenti lo apprezzeranno, e così anche i tuoi profitti.

Di Alex Weinstein  

Alex Weinstein è il chief digital officer di Hungryroot. In precedenza, ha ricoperto il ruolo di vicepresidente senior per la crescita presso Grubhub. Alex ha una laurea in Informatica presso l’UCLA. 

 

Di ihal