Facebook crea chatbot open-domain dal suono naturale, formati su 1,5 miliardi di post Reddit
Facebook ha recentemente lanciato un chatbot di dominio aperto chiamato “Blender”. Come riportato dalla BBC , Facebook Blender è il suo chatbot di dominio aperto più grande di sempre e secondo la compagnia, è in grado di mostrare empatia, personalità e conoscenza, superando e sentendosi più umano di altri chatbot. Blender è disponibile per l’uso in tre diverse varianti, ognuna con un diverso livello di complessità e raffinatezza del modello. Esiste un modello neurale di 90 milioni di parametri, un modello di parametri di 2,7 miliardi e un modello di parametri di 9,4 miliardi. Il modello di parametri da 9,4 miliardi è circa 3,6 volte più grande del più grande chatbot attualmente esistente.
Facebook afferma che Blender è il primo chatbot ampiamente disponibile che fonde insieme un insieme complesso e diversificato di abilità di conversazione come conoscenza ed empatia. Il chatbot di Blender è in grado di discutere una varietà di argomenti e portare avanti una conversazione che traccia fino a 14 “turni” di conversazione. Secondo quanto riferito, circa il 49% delle persone che hanno interagito con il chatbot ha preferito interagire con il bot anziché con un altro essere umano.
Blender è stato addestrato utilizzando i dati raccolti da conversazioni di dominio pubblico raccolte da siti di social media come Reddit. Il set di dati utilizzato per addestrare Blender comprendeva circa 1,5 miliardi di esempi di conversazioni. Mentre i dati di allenamento e la raffinatezza del modello hanno permesso al chatbot di svolgere discussioni complesse e avere un aspetto più naturale e umano, ci sono stati alcuni problemi che si sono manifestati a seguito di questa tecnica di allenamento. Secondo i ricercatori, Blender a volte rispondeva alle richieste di conversazione in modo aggressivo o con un linguaggio offensivo. Inoltre, il chatbot occasionalmente rispondeva con falsità e fatti inventati. Il team di ricerca è ottimista sul fatto che le revisioni del modello affronteranno questi problemi, ma hanno comunque voluto rilasciare i modelli.
Secondo un portavoce di Facebook, come citato dalla BBC , “rilasciare modelli è essenziale per consentire approfondimenti completi e affidabili sulle loro capacità”.
I ricercatori di Facebook dovranno ancora superare due grandi sfide per avere successo, secondo il direttore generale della consulenza di intelligenza artificiale The Envisioners, Dave Choplin. Come citato dalla BBC, Choplin ritiene che i ricercatori dovranno affrontare grandi sfide nel replicare le molte sfumature delle conversazioni che gli umani spesso danno per scontate e che i dati usati per addestrare il modello potrebbero inibirlo in modi che i ricercatori di Facebook potrebbero trovare difficile da superare .
“Per quanto sia una piattaforma fantastica come Reddit, gli algoritmi di allenamento basati sulle conversazioni che trovi ti faranno ottenere un sacco di paglia tra il grano”, ha detto Choplin.
Facebook ha fatto un confronto tra il proprio chatbot di Blender e il chatbot contemporaneo di Google soprannominato Meena. Il post sul blog di Facebook mostrava confronti tra Meena e Blender e, secondo i dati di Facebook, circa il 75% degli intervistati che avevano avuto una conversazione con Blender affermava che avrebbero preferito avere una discussione prolungata con Blender su Meena. Inoltre, circa il 67% degli intervistati ha affermato che Blender era più naturale e umano di Meena quando si trattava di lunghe conversazioni.
In futuro, il team di ricerca di Facebook vuole migliorare la capacità di conversazione dei modelli, progettando modelli in grado di supportare conversazioni ancora più lunghe con l’assistenza di nuove funzioni e architetture di perdita. Inoltre, i ricercatori mirano a gestire il pregiudizio di genere e il linguaggio potenzialmente dannoso creando migliori classificatori e dati di formazione più rappresentativi.