Facebook AI Research ha annunciato lo sviluppo di un nuovo chatbot – Blender, che sostengono di essere il modello di chatbot open-domain più grande di sempre, allo stato dell’arte. La società ha affermato che il chatbot può superare gli altri modelli in termini di coinvolgimento e può anche sentirsi più umano.
In un recente tweet, l’IA di Facebook ha confermato la notizia affermando: “Oggi stiamo annunciando che l’IA di Facebook ha creato e aperto Blender, il più grande chatbot di dominio aperto di sempre. Supera gli altri in termini di coinvolgimento e si sente anche più umano, secondo i valutatori umani. ”
La società ha anche pubblicato un post sul blog in cui affermava: “Questa è la prima volta che un chatbot ha imparato a fondere diverse abilità di conversazione – inclusa la capacità di assumere un personaggio, discutere quasi ogni argomento e mostrare empatia – in modo naturale, 14 -scorri i flussi di conversazione. “
Ha inoltre affermato: “La nostra nuova ricetta incorpora non solo modelli neurali su larga scala, con un massimo di 9,4 miliardi di parametri – o 3,6 volte di più rispetto al più grande sistema esistente – ma anche tecniche altrettanto importanti per la fusione di abilità e generazione dettagliata”.
Secondo il blog, Blender è il risultato di un culmine di anni di ricerca nell’intelligenza artificiale conversazionale, in cui include empatia, conoscenza e personalità – insieme in un unico sistema. La società ha incluso tecniche di decodifica migliorate, il nuovo mix di competenze e un modello con 9,4 miliardi di parametri, che è 3,6 volte più del più grande sistema esistente, al fine di costruire questo modello di chatbot.
Leggi anche Andrew Ng Piani di rilancio della produzione attraverso l’intelligenza artificiale
La società ha rilasciato il suo codice modello completo e il set-up di valutazione in modo che altri ricercatori di intelligenza artificiale possano riprodurre questo lavoro e continuare ad avanzare nella ricerca di IA conversazionale.
Secondo i ricercatori, Blender ha diverse competenze. La società ha svolto una formazione su larga scala per la creazione del chatbot coinvolgendo 1,5 miliardi di esempi di formazione di conversazioni estratte. Ha inoltre utilizzato il parallelismo del modello basato su colonne, che ha permesso ai ricercatori di dividere la rete neurale in pezzi più piccoli e più gestibili mantenendo la massima efficienza.
Blender ha anche appreso le abilità di fusione per l’addestramento e la valutazione di queste abilità BST desiderabili, tra cui, l’uso coinvolgente della personalità, l’uso della conoscenza coinvolgente, la dimostrazione di empatia e la capacità di fondere tutti e tre senza soluzione di continuità. Secondo il blog, “Mescolare queste abilità è una sfida difficile perché i sistemi devono essere in grado di passare da un’attività all’altra quando appropriato, come ad esempio regolare il tono se una persona passa da scherzare a serio. Il nostro nuovo set di dati BST fornisce un modo per costruire sistemi che mescolano ed esibiscono questi comportamenti. Abbiamo scoperto che la messa a punto del modello con BST ha un effetto drammatico sulle valutazioni umane delle capacità di conversazione del bot. “
I ricercatori hanno inoltre scoperto che la lunghezza delle espressioni dell’agente è importante per ottenere risultati migliori con i valutatori umani. La società ha dimostrato che un’attenta scelta degli iperparametri di ricerca potrebbe dare risultati positivi controllando questo compromesso. In particolare, l’ottimizzazione della lunghezza minima del raggio offre un controllo importante sullo spettro di risposte “noioso contro piccante”.
Per valutare il modello, i ricercatori hanno confrontato le sue prestazioni con l’ultimo chatbot Meena di Google attraverso valutazioni umane a coppie. Dal momento che il loro modello non è stato rilasciato, i ricercatori hanno utilizzato circa 100 registri rilasciati pubblicamente e randomizzati per questa valutazione. Usando il metodo ACUTE-Eval, ai valutatori umani è stata mostrata una serie di dialoghi tra umani accoppiati con ciascun rispettivo chatbot.
L’intelligenza artificiale di Facebook è entusiasta dei progressi compiuti nel miglioramento dei chatbot di dominio aperto. Sebbene siano ancora lontani dal raggiungere l’intelligenza a livello umano nei sistemi di dialogo, i ricercatori stanno attualmente esplorando modi per migliorare ulteriormente la qualità della conversazione dei nostri modelli in conversazioni più lunghe con nuove architetture e diverse funzioni di perdita.
“I veri progressi nel campo dipendono dalla riproducibilità, l’opportunità di sfruttare la migliore tecnologia possibile. Riteniamo che il rilascio di modelli sia essenziale per consentire approfondimenti completi e affidabili sulle loro capacità. Ecco perché abbiamo reso il nostro chatbot di dominio aperto all’avanguardia pubblicamente disponibile attraverso la nostra piattaforma di ricerca sul dialogo ParlAI. Con il codice open source per la messa a punto e l’esecuzione di valutazioni automatiche e umane, speriamo che la comunità di ricerca dell’IA possa basarsi su questo lavoro e far avanzare collettivamente l’IA conversazionale “, ha affermato il blog.