Un team di ricercatori ha recentemente introdotto Light-R1-32B, un modello di intelligenza artificiale open source ottimizzato per la risoluzione di problemi matematici avanzati. Questo modello, composto da 32 miliardi di parametri, è stato reso disponibile su Hugging Face sotto una licenza Apache 2.0 permissiva, permettendo a imprese e ricercatori di utilizzarlo, implementarlo, perfezionarlo o modificarlo liberamente, anche per scopi commerciali.
Wikipedia
Light-R1-32B ha superato le prestazioni di modelli open source di dimensioni simili (e anche maggiori), come DeepSeek-R1-Distill-Llama-70B e DeepSeek-R1-Distill-Qwen-32B, in benchmark di terze parti come l’American Invitational Mathematics Examination (AIME). L’AIME è composto da 15 problemi matematici progettati per studenti estremamente avanzati e prevede un tempo limite di 3 ore per gli utenti umani.
Incredibilmente, i ricercatori hanno completato l’addestramento del modello in meno di sei ore utilizzando 12 GPU Nvidia H800, con un costo totale stimato di $1.000. Questo rende Light-R1-32B una delle soluzioni più accessibili e pratiche per lo sviluppo di modelli di intelligenza artificiale specializzati in matematica ad alte prestazioni. Tuttavia, è importante notare che il modello è stato addestrato a partire da una variante del Qwen 2.5-32B-Instruct open source di Alibaba, che presumibilmente ha comportato costi di addestramento iniziali molto più elevati.
Oltre al modello, il team ha rilasciato i dataset di addestramento, gli script di addestramento e gli strumenti di valutazione, fornendo un framework trasparente e accessibile per la costruzione di modelli di intelligenza artificiale focalizzati sulla matematica.
L’arrivo di Light-R1-32B segue sforzi simili da parte di rivali come Microsoft con la sua serie Orca-Math. Questo sviluppo rappresenta un passo significativo verso la democratizzazione dell’accesso a strumenti di intelligenza artificiale avanzati, in particolare nel campo del ragionamento matematico.