L’IA conversazionale basata su segnali non verbali può essere più efficace

L’intelligenza artificiale è ora prevalente nel servizio clienti. Tuttavia, la maggior parte delle applicazioni di servizio clienti abilitate per AI rimangono radicate nelle tecniche di elaborazione del linguaggio naturale (NLP). Con la PNL, il software analizza le conversazioni e cerca di dedurre il successo della conversazione da ciò che viene detto. Cogito , una società di intelligenza artificiale con sede a Boston concepita dalla tecnologia e dalla ricerca del MIT Media Lab , utilizza l’intelligenza artificiale basata sulla voce per analizzare i segnali comportamentali e il contenuto della conversazione per fornire un feedback sul momento durante le conversazioni, guidando le persone ad avere migliori interazioni.

Il software di coaching dell’azienda migliora il risultato delle chiamate al servizio clienti raccogliendo segnali verbali e non verbali dal discorso, come tono, tono, cadenza e turno, per fare previsioni più accurate sull’esito della chiamata. Queste sfumature di conversazione vengono immediatamente elaborate e utilizzate per istruire i rappresentanti del servizio clienti a fornire risoluzioni in modo più efficace ed efficiente.

“Cogito è stata fondata nel 2006 dal Dr. Alex” Sandy “Pentland, dal Dr. Ali Azarbayejani e da Josh Feast”, ha spiegato il Dr. Skyler Place, Chief Behavioral Science Officer di Cogito. “Sandy ha decenni di esperienza nella comprensione delle prestazioni umane e di come i diversi segnali possono essere misurati dalle macchine per capire come si comportano le persone. Lui e Josh, che è stato il nostro CEO sin dalla sua fondazione, hanno visto la necessità di contribuire ad elevare le nostre capacità naturali. Il concetto originale era basato su questa idea di “segnali onesti” e su come i segnali non verbali possono influenzare i risultati. Sandy aveva svolto una serie di studi accademici che mostravano che poteva prevedere la probabilità che un primo appuntamento avesse successo, il successo del colloquio di lavoro e il successo della negoziazione salariale da come le persone parlano. Si tratta di comprensione, il coinvolgimento e la connessione tra due persone possono essere migliorati. “

Capire l’interazione di successo
Le interazioni guidano il nostro mondo. Durante la pandemia, a causa del distacco sociale, abbiamo tutti notato il divario che avevamo nel nostro lavoro quotidiano e nella vita privata dalla mancanza di interazioni umane. Le restrizioni nei nostri mondi virtuali tramite strumenti di videoconferenza tendono a causare incomprensioni create dalla mancanza di consapevolezza dei segnali comportamentali che ci consentono di comprendere appieno il contesto delle nostre conversazioni.

Dobbiamo comunicare in modo più diretto gli uni con gli altri, centrare le nostre discussioni su argomenti rilevanti e porre le domande giuste per ottenere risultati positivi dalle nostre interazioni.

Ma, come esseri umani, siamo intrinsecamente prevenuti.

Quando interpretiamo i segnali comportamentali delle persone, siamo guidati dalle nostre interazioni passate con la persona. Queste interazioni passate sono “colorate” con giudizi, emozioni e altri obiettivi personali con cui vediamo le nostre interazioni. È qui che i dati dell’intelligenza artificiale possono essere utili. I segnali del discorso sono distinti da persona a persona e da situazione a situazione. Sono dati più affidabili dei soli schemi di discorso delle persone. Un copione può alterare il discorso verbale, ma il modo in cui le persone si esprimono, il modello della loro “norma” è difficile da cambiare o duplicare. Avendo la loro “norma”, qualsiasi cambiamento può essere misurato e rilevato per essere correlato a comportamenti che possono aiutare a ottenere una maggiore comprensione.

“Piuttosto che avvisare un agente che un cliente si sente un certo lontano, la tecnologia di Cogito identifica i modelli che si stanno verificando e fornisce un’assistenza alle loro tecniche di conversazione, come rallentare il ritmo”, ha sottolineato Place. “Forniamo agli agenti una guida specifica per la chiamata in tempo reale, non dopo il fatto che è più probabile che il cambiamento sia fuori contesto e non si attenga. Questo è davvero il cuore del nostro sistema. Questa comprensione comportamentale e guida nelle conversazioni che si relazionano o si correla alle emozioni sottostanti “.

Place ha continuato a spiegare: “Non stiamo solo fornendo un rapporto che ci dice che il 20% dei nostri clienti è arrabbiato. Stiamo fornendo ai rappresentanti del servizio clienti indicazioni su cosa possono fare per migliorare l’esperienza di chiamata. Ascolta in modo più efficace, aumenta l’empatia, aumenta l’energia, smetti di interrompere – lo chiami. “


Uno dei maggiori fattori di successo della conversazione è l’empatia. Quando due persone possono riconoscere il punto di vista dell’altro, convalidare la loro posizione, la loro conversazione può avere un esito più positivo. La piattaforma di Cogito utilizza in modo univoco uno spunto di empatia per aiutare gli agenti a stabilire un riconoscimento e mezzi per comunicare con empatia in una data situazione.

“Lo spunto di empatia è stato progettato per rilevare i momenti in cui un cliente trarrebbe vantaggio dal riconoscimento del bisogno di empatia e dal riconoscimento di un momento emotivo nella conversazione”, ha spiegato Place. “Potrebbe apparire in un momento positivo o negativo in un’interazione, spingendo l’agente a reagire e rispondere dato il contesto della chiamata. È uno dei tanti modi in cui eleviamo l’esperienza umana e aumentiamo le capacità naturali di una persona con la tecnologia “.

Avendo un allenatore di intelligenza artificiale, gli agenti del servizio clienti diventano più consapevoli dei comportamenti umani e continuano ad avere la libertà di agire come farebbero normalmente, ma con maggiore empatia.

L’altro driver per il buon esito di una conversazione è il contesto conversazionale. Le emozioni guidano il contesto. Le persone spesso dicono che “non è quello che dici, ma come lo dici”.

Le emozioni raccolte dal discorso e i comportamenti di parlare di qualcuno danno al contesto della conversazione che consente agli altri di recuperare intuizioni. A differenza di altre piattaforme di servizio clienti abilitate dall’intelligenza artificiale, Cogito si concentra sulla presentazione di soluzioni per aiutare a gestire le emozioni sottostanti espresse nelle conversazioni invece di limitarsi a identificare i sentimenti stessi.

Place ha spiegato: “Pensiamo che le emozioni abbiano due componenti. I primi sono i comportamenti che stanno accadendo in un dato momento e poi i secondi sono la relazione del comportamento con i risultati desiderati. L’emozione reale si trova nel terzo secchio. Li attacciamo indirettamente attraverso il nostro approccio di machine learning. Se dico a un agente che un cliente è arrabbiato in questo momento, non sa necessariamente cosa fare con quelle informazioni. Quello che facciamo è rilevare quali comportamenti parlando si stanno verificando e informare l’agente su cosa fare per migliorare l’aspetto emotivo sottostante della conversazione “.

Concentrandosi sulla presentazione di soluzioni di coaching ai rappresentanti del servizio clienti, aumenta il coinvolgimento all’interno delle conversazioni. Cogito fornisce anche dashboard che consentono ai responsabili del servizio clienti di vedere il quadro consolidato dei team del servizio clienti per aiutarli a essere più coinvolti.

“In precedenza, prima del distacco sociale e del lavoro a distanza, i manager dei call center” camminavano sul pavimento “per ascoltare le chiamate e rilevare chi aveva bisogno di aiuto”, ha detto Place. “Ora, tuttavia, hanno completamente perso quella capacità.”

Quando i manager possono prendere il “polso” dell’ambiente di lavoro, possono capire meglio come promuovere emozioni positive in un ambiente di call center che è irto di problemi.

Place ha continuato a spiegare: “In Cogito, abbiamo sfruttato la nostra capacità di comprendere le chiamate e creato dashboard per aiutare i manager a capire come stanno i loro dipendenti in tempo reale, dentro o fuori dal call center. Con l’avanzare del lavoro a distanza, i manager possono virtualmente camminare sul pavimento e vedere le prestazioni, consentendo loro di gestire, aiutare e istruire i lavoratori a casa “.

Raccogliendo queste informazioni a livello contestuale che fungono da coach per aiutare gli agenti del servizio clienti, le informazioni a livello contestuale aggregate possono fungere da fonte per i manager per comprendere le capacità emotive, i carichi di lavoro e le pianificazioni dei turni dei rappresentanti del servizio clienti. Quando i manager possono ottimizzare le loro operazioni per essere più incentrate sull’uomo e sulle relazioni, la loro leadership può essere più incentrata sull’uomo ed efficace nel tempo.

Abbiamo bisogno di algoritmi migliori per queste previsioni? Abbiamo bisogno di più dati?
Quando si tratta di applicazioni per il servizio clienti abilitate all’intelligenza artificiale, spesso immaginiamo che la raccolta di dati audio sia il primo passo. Ad un certo punto, dovremo raccogliere dati sul viso per migliorare la precisione.

Ma abbiamo bisogno di tutti questi dati?

“Oggi ci concentriamo solo sull’audio, analizzando le conversazioni e i segnali vocali all’interno del prodotto, offrendo un ricco flusso di dati”, ha sottolineato Place. “Non usiamo il riconoscimento facciale o i dati video per ottenere la gentile precisione e il valore che i nostri clienti cercano. La maggior parte dei nostri clienti registra già le conversazioni per motivi di conformità e qualità, informando i clienti su ogni chiamata che queste chiamate vengono registrate e monitorate per scopi di qualità. L’analisi di Cogito è un altro livello di intelligenza oltre al software esistente che analizza le chiamate da decenni “.

A seconda del caso d’uso e dello scopo dei dati, è del tutto possibile che nell’area del servizio clienti, gli agenti possano fornire un livello adeguato di servizio da servizi di coaching abilitati AI che utilizzano solo dati vocali per le previsioni. Tuttavia, quando le applicazioni sono più interessate a dedurre le intenzioni del cliente di acquistare il prodotto o influenzare il comportamento del cliente, potremmo aver bisogno di algoritmi più sofisticati oltre al deep learning per ottenere una maggiore precisione.

Place ha spiegato: “Abbiamo algoritmi che esaminano due diverse categorie di previsioni in questo momento. Ci sono quelli che misurano ciò che sta accadendo in una conversazione, quanto velocemente parli, quanta energia c’è nella tua voce e così via. Questi misurano i segnali fisici e tendono ad essere molto precisi. Dove le cose si fanno interessanti è quando guardi le valutazioni e le previsioni di cose come l’intenzione del cliente o la probabilità di acquistare un prodotto. È qui che negli ultimi 10 anni la tecnologia è davvero avanzata con il deep learning, più dati e approcci creativi per aumentare la precisione. Penso che sia lì che continuerai a vedere il potenziale di avanzamento e dove nuovi algoritmi, nuovi approcci continueranno ad aprire nuove porte per comprendere le implicazioni aziendali a valle di alcune di queste tecnologie “.

Man mano che l’uso dell’IA conversazionale diventa più diffuso, anche gli algoritmi di previsione del comportamento diventeranno più accurati. Probabilmente vedremo applicazioni più sofisticate in ambienti controllati come le impostazioni del colloquio, la negoziazione, ecc. Per avere un impatto su un risultato positivo, l’IA può fornire più dati e contesto ai partecipanti di una conversazione per migliorare il loro processo decisionale. Ma, alla fine, il punto di decisione di una discussione risiede ancora con i singoli partecipanti.

“Riteniamo che l’intelligenza artificiale non sostituisca la connessione umana”, ha detto Place. “Ha lo scopo di aumentare le capacità dell’umano e riconoscere il bisogno di empatia, e quindi consentire all’umano di prendere la decisione di seguire il miglior processo che porterà al miglior risultato, per la conversazione e il cliente.”

Di ihal