Mistral AI ha presentato Math-tral, un nuovo modello 7B specializzato nel ragionamento matematico avanzato e nell’esplorazione scientifica. Questo modello è stato rilasciato sotto licenza Apache 2.0 in onore del 2311° anniversario di Archimede.
Math-tral è progettato per affrontare complesse sfide di ragionamento logico in più fasi nei campi STEM (scienza, tecnologia, ingegneria e matematica). Sviluppato in collaborazione con Project Numina, Math-tral eredita le capacità del modello Mistral 7B, raggiungendo prestazioni eccellenti nei benchmark standard del settore. Ha ottenuto un punteggio del 56,6% nel test MATH e del 63,47% su MMLU, dimostrando capacità di ragionamento superiori nella sua categoria di dimensioni.
I benchmark dettagliati mostrano miglioramenti significativi nelle prestazioni di Math-tral, con aumenti della precisione nei calcoli dei tempi di inferenza. Ad esempio, Math-tral 7B ha raggiunto un punteggio del 68,37% nel test MATH con il voto a maggioranza e del 74,59% con un forte modello di ricompensa tra 64 candidati.
Math-tral è immediatamente disponibile per l’uso e l’adattamento attraverso gli strumenti di Mistral AI. Gli sviluppatori possono implementare il modello utilizzando l’inferenza di Mistral per esplorazioni iniziali e perfezionare le sue capacità con ulteriori strumenti. I pesi del modello sono accessibili tramite HuggingFace, facilitando l’integrazione in progetti accademici e di ricerca.
Con il rilascio di Math-tral alla comunità scientifica, Mistral AI mira a promuovere i progressi nella risoluzione dei problemi matematici e a sostenere gli sforzi accademici. Questa iniziativa sottolinea l’impegno di Mistral AI nel promuovere architetture di modelli specializzati e le loro applicazioni pratiche nella scoperta scientifica.