RULER: il nuovo benchmark di NVIDIA per valutare modelli linguistici
I ricercatori di NVIDIA hanno creato RULER, un nuovo benchmark per valutare l’efficacia dei modelli linguistici a contesto lungo (LLM) in diverse attività, come il recupero, il tracciamento multi-hop, l’aggregazione…
I modelli AI apprendono dal linguaggio dei bambini?
Un nuovo studio della New York University ha rivelato che i modelli di intelligenza artificiale possono apprendere da conversazioni di bambini, aprendo nuove prospettive sull’acquisizione del linguaggio. Anche se l’apprendimento…
Docusign introduce l’AI per governare gli accordi commerciali
Docusign si allontana dalla semplice firma elettronica e abbraccia l’intelligenza artificiale per risolvere il problema della “trappola degli accordi”. Il nuovo sistema, chiamato “Gestione Intelligente degli Accordi” (IAM), trasforma gli…
Il Nuovo Set di Dati OpenEQA di Meta AI
I ricercatori di Meta AI hanno presentato OpenEQA, un nuovo set di dati open source che mira a valutare la capacità di un sistema di intelligenza artificiale di rispondere a…