Nel mondo dell’assistenza vocale multilingue, Amazon ha annunciato un nuovo set di dati chiamato MASSIVE, una nuova competizione che utilizza MASSIVE e un workshop, Massively Multilingual NLU 2022.
Immagina se tutti nel mondo potessero utilizzare i sistemi di intelligenza artificiale vocale come Alexa nella loro lingua madre. Un approccio promettente per realizzare questa visione è la comprensione del linguaggio naturale massicciamente multilingue (MMNLU). È un paradigma in cui un singolo modello ML può spiegare e comprendere input da molti linguaggi tipologicamente diversi. Questo modello può apprendere una rappresentazione condivisa dei dati che abbraccia le lingue e trasferire la conoscenza dalle lingue con abbondanti dati di addestramento a quelle in cui i dati di addestramento sono scarsi.
Amazon ha fatto tre annunci relativi a MMNLU rilasciando:
Un nuovo set di dati chiamato MASSIVE , composto da un milione di espressioni etichettate in 51 lingue, insieme al codice open source, fornisce esempi di esecuzione di modelli NLU multilingui in modo massiccio e consente ai professionisti di ricreare i risultati di base per la classificazione degli intenti e il riempimento degli slot.
Una nuova competizione che utilizza il set di dati MASSIVE chiamato Massively Multilingual NLU 2022 (MMNLU-22).
Prem Natarajan , VP di Alexa AI Natural Understanding, ha dichiarato: “Siamo molto entusiasti di condividere questo ampio set di dati multilingue con la comunità di ricerca linguistica mondiale. Ci auguriamo che il set di dati aiuterà i ricercatori di tutto il mondo a guidare nuovi progressi nella comprensione del linguaggio multilingue che espandono la disponibilità e la portata delle tecnologie di IA conversazionale”.