Alibaba ha annunciato che il suo nuovo modello di intelligenza artificiale, Qwen2-Math, è ora il migliore nella risoluzione di problemi complessi di matematica. Lanciato l’8 agosto 2024, questo modello ha subito attirato l’attenzione per le sue straordinarie capacità nel campo della matematica.

Qwen2 fa parte della serie di modelli di linguaggio di grandi dimensioni (LLM) “Tongyi Qianwen” di Alibaba Cloud. Alibaba Cloud, la divisione tecnologica di Alibaba, ha lanciato i suoi modelli Qwen a partire dall’agosto 2023. Questi modelli variano in dimensioni e funzionalità, inclusi Qwen-7B, Qwen-72B e Qwen-1.8B, tra gli altri. L’aggiunta più recente, Qwen2, è stata introdotta nel giugno 2024 con cinque versioni, che vanno da 0,5 miliardi a 72 miliardi di parametri.

Qwen2-Math è un sottoinsieme di Qwen2 progettato specificamente per eccellere nella matematica. È disponibile in diverse versioni, con il modello da 72 miliardi di parametri, Qwen2-Math-72B-Instruct, che guida il gruppo. Questa versione ha ottenuto un impressionante punteggio dell’84% al MATH Benchmark, che testa l’IA su 12.500 problemi matematici complessi. Inoltre, si comporta eccezionalmente bene in altri benchmark, con un punteggio del 96,7% nella matematica delle scuole elementari (GSM8K) e del 47,8% nella matematica a livello universitario.

Qwen2-Math supera altri modelli leader come GPT-4o di OpenAI, Claude 3.5 Sonnet di Anthropic e Math-Gemini Specialized 1.5 Pro di Google nella risoluzione dei problemi matematici. Sebbene Alibaba non abbia confrontato direttamente Qwen2-Math con il nuovo modello Orca-Math di Microsoft, il Qwen2-Math-7B-Instruct è notevolmente più preciso di Orca-Math in alcuni test.

I modelli di IA focalizzati sulla matematica, come Qwen2-Math, mirano a offrire soluzioni più affidabili per problemi matematici complessi, al di là degli usi tipici dell’IA in chatbot e nella elaborazione dei documenti. L’obiettivo di Alibaba con Qwen2-Math è fornire strumenti utili per risolvere problemi matematici intricati.

Qwen2-Math è disponibile con termini di licenza flessibili. Sebbene non sia completamente open source, l’uso commerciale è consentito per molte aziende senza costi aggiuntivi, a condizione che non superino i 100 milioni di utenti attivi mensili. Questo lo rende accessibile per startup e piccole imprese.

Di Fantasy