Un chatbot può dedicarsi a chiacchiere? Microsoft dice di sì!
GODEL combina due funzionalità in un unico modello.
Microsoft ha reso open source il suo Grounded Open Dialogue Language Model (GODEL). Il gigante della tecnologia sta rendendo open source tre versioni di GODEL: piccola (GODEL B ) e grande (GODEL L ) avviate rispettivamente da T5 e T5-Large e un modello molto grande (GODEL XL GPT-J ) addestrato da GPT-J . I codici sono disponibili su Github .
GODEL
GODEL si è evoluto dal progetto DialoGPT 2019 di Microsoft, il primo modello di linguaggio preaddestrato su larga scala progettato specificamente per il dialogo . Il modello linguistico è pre-addestrato in tre fasi, piegando successivamente i dati dal testo web, dialoghi aperti pubblicamente da fonti come Reddit e una raccolta di corpora esistenti che supportano compiti di dialogo fondati.
GODEL combina due funzionalità in un unico modello. Il primo è orientato al compito e il secondo rende il dialogo più realistico e sociale. La maggior parte dei chatbot si concentra sull’essere l’uno o l’altro. L’agente può consigliare un ristorante e allo stesso tempo impegnarsi in chiacchiere su sport o giochi meteorologici, quindi riportare la conversazione in carreggiata.
GODEL è parametrizzato con un modello di codificatore-decodificatore basato su Transformer e addestrato per la generazione di risposte basata su testo esterno, che consente una messa a punto più efficace delle attività di dialogo che richiedono il condizionamento della risposta su informazioni esterne alla conversazione corrente (ad es. documento recuperato).
IA conversazionale
Il mercato dell’IA conversazionale valeva 6,9 miliardi di dollari nel 2021. Si stima che cresca a un CAGR del 23,4 percento, con un fatturato di circa 29,9 miliardi di dollari entro la fine del 2028. Nel corso degli anni, abbiamo assistito all’emergere del Segmento Bots-as-a-service (BaaS). Sempre più organizzazioni si affidano all’IA conversazionale per ottimizzare l’esperienza del cliente.
“I giganti della tecnologia e le iniziative open source stanno facendo del loro meglio per spingere soluzioni e prodotti di IA conversazionale ai clienti aziendali, la maggior parte di loro si limita a supportare o assistere i team a un certo livello”, ha affermato Ashwin Swarup, VP di Data Science and Data Engineering presso Digité Inc.
È qui che entrano in gioco modelli linguistici come GODEL. E se il robot AI fosse in grado di parlarti di qualsiasi evento mondiale attuale oltre a risolvere le tue domande? Secondo Microsoft, questi giorni non sono lontani.
Una conversazione con GODEL
“Molte aziende oggi stanno cercando di sviluppare chatbot per affrontare i problemi dei clienti finali in tempo reale e offrire loro un’esperienza senza interruzioni. La personalizzazione dei chatbot gioca un ruolo fondamentale nel migliorare l’esperienza dell’utente finale”, ha aggiunto Swarup.
Anche Microsoft offre chatbot AI come servizio sul mercato dei servizi cloud di Azure chiamato Azure Bot Service.
Microsoft e open source
Aziende come Hugging Face stanno raddoppiando i propri sforzi per democratizzare AI e ML attraverso l’open source e la scienza aperta. Oggi la piattaforma offre 100.000 modelli pre-addestrati e 10.000 set di dati per NLP, visione artificiale, discorso, serie temporali, biologia, apprendimento per rinforzo, chimica e altro ancora.
I modelli di intelligenza artificiale open source sono importanti perché rendono la tecnologia accessibile a tutti i membri della comunità. Prendendo spunto, Google, Meta e Amazon stanno ora open-sourcing dei loro modelli. Microsoft è stata contraria all’open source fino al 2010. Successivamente, il gigante della tecnologia si è unito all’Open Source Initiative nel 2016.
Nel 2019, Microsoft ha reso open source l’algoritmo che alimenta il suo motore di ricerca Bing. L’anno scorso, la società ha reso disponibile una libreria di “miscela di esperti” open source per addestrare enormi modelli di intelligenza artificiale. Allo stesso modo, nel 2020, ha reso open source una libreria chiamata DeepSpeed per addestrare il modello Turing Natural Language Generation (T-NLG), il più grande modello di elaborazione del linguaggio naturale (NLP) di allora.
Per quanto riguarda l’open source GODEL, Microsoft ha dichiarato: “Ci auguriamo che GODEL aiuti numerosi team di ricerca accademici a far avanzare il campo dell’IA conversazionale con modelli di dialogo innovativi eliminando la necessità di risorse GPU significative. Abbiamo in programma di migliorare continuamente GODEL e rendere disponibili più modelli alla comunità di ricerca”.