Mistral AI, startup europea emergente, ha annunciato il lancio di un nuovo modello linguistico che promette di eguagliare le prestazioni di modelli tre volte più grandi, riducendo significativamente i costi computazionali. Questa innovazione potrebbe rimodellare l’economia dell’implementazione dell’IA avanzata.
Il nuovo modello, denominato Mistral Small 3, vanta 24 miliardi di parametri e raggiunge un’accuratezza dell’81% su benchmark standard, elaborando 150 token al secondo. L’azienda lo rilascia sotto la permissiva licenza Apache 2.0, consentendo alle imprese di modificarlo e implementarlo liberamente.
“Crediamo che sia il miglior modello tra tutti quelli con meno di 70 miliardi di parametri”, ha affermato Guillaume Lample, Chief Science Officer di Mistral, in un’intervista esclusiva con VentureBeat. “Stimiamo che sia sostanzialmente al pari del Llama 3.3 70B di Meta, rilasciato un paio di mesi fa, che è un modello tre volte più grande.”
L’approccio di Mistral si concentra sull’efficienza piuttosto che sulla scala. L’azienda ha ottenuto miglioramenti nelle prestazioni principalmente attraverso tecniche di addestramento ottimizzate, evitando l’uso di tecniche comuni come l’apprendimento per rinforzo o dati di addestramento sintetici.
“Ciò che è cambiato sono fondamentalmente le tecniche di ottimizzazione dell’addestramento”, ha spiegato Lample. “Il modo in cui addestriamo il modello è stato un po’ diverso, un modo diverso di ottimizzarlo.”
Il modello è stato addestrato su 8 trilioni di token, rispetto ai 15 trilioni di modelli comparabili, secondo Lample. Questa efficienza potrebbe rendere le capacità avanzate dell’IA più accessibili alle aziende preoccupate per i costi computazionali.
L’annuncio arriva in un momento di intensa attenzione sui costi di sviluppo dell’IA, in seguito alle affermazioni della startup cinese DeepSeek di aver addestrato un modello competitivo con un budget significativamente inferiore. Queste dichiarazioni hanno sollevato interrogativi sugli ingenti investimenti effettuati dai giganti tecnologici statunitensi.
Con Mistral Small 3, Mistral AI dimostra che è possibile ottenere prestazioni elevate con modelli più compatti ed efficienti, aprendo la strada a un’adozione più ampia dell’IA in vari settori. Questo sviluppo potrebbe segnare un punto di svolta nell’evoluzione dell’intelligenza artificiale, rendendo la tecnologia più accessibile e sostenibile per le imprese di tutte le dimensioni.