Il nuovo modello “o1-Mini” di OpenAI sta attirando l’attenzione per le sue prestazioni superiori rispetto al precedente “o1 Preview”. Nonostante le sue dimensioni ridotte, ci si aspetta che rappresenti un punto di svolta nello sviluppo dell’intelligenza artificiale (AI) grazie alla sua eccellente performance e al prezzo contenuto.
Secondo le informazioni pubblicate da OpenAI il 19 settembre, o1-Mini si distingue per la sua competitività. Il modello ha ottenuto risultati migliori in matematica, classificandosi al terzo posto nel ranking di LMSYS basato su preferenze umane, dietro solo a o1-Preview e GPT-4o.
o1-Mini ha dimostrato di eccellere in compiti di matematica e programmazione, quasi eguagliando le performance di o1 in benchmark come AIME e CodeForce. Questo è stato possibile grazie a un design ottimizzato che si concentra sulle funzioni di inferenza piuttosto che su una vasta conoscenza generale. Di conseguenza, il modello supera gli altri nel ragionamento matematico e nella codifica.
Inoltre, o1-Mini permette agli utenti di utilizzare un numero maggiore di token rispetto al modello di anteprima, elaborando i token tre volte più velocemente. Questo consente a Mini di “pensare” più a lungo, portando a risposte di qualità superiore.
OpenAI ha anche ridotto i costi associati a o1-Mini. Rispetto a o1-Preview, che è da 4 a 6 volte più costoso del modello “GPT-4o”, o1-Mini costa circa l’80% di Freeview. L’azienda sta lavorando per abbassare ulteriormente i costi.
Tuttavia, è importante notare che o1-Mini non è un modello universale per conversazioni in linguaggio naturale. È specializzato in inferenze, il che significa che le risposte possono richiedere tempo e non sono sempre immediate. Inoltre, le sue prestazioni in termini di conoscenza generale sono inferiori rispetto a Preview e GPT-4o.
Nonostante queste limitazioni, o1-Mini offre vantaggi significativi in ambiti specifici come matematica, scienze e programmazione, dove le allucinazioni—risposte errate generate dal modello—possono avere conseguenze gravi, come nella finanza o nella medicina. Questo sviluppo è fondamentale per spingere oltre i confini degli attuali modelli linguistici di grandi dimensioni (LLM).
La risposta dei concorrenti, come Google e Anthropic, è ora attesa con interesse. Riuscire a competere con OpenAI su dimensioni dei modelli e infrastrutture informatiche sta diventando sempre più difficile.
In conclusione, il modello o1-Mini potrebbe segnare una svolta significativa nello sviluppo dell’AI, offrendo prestazioni elevate a un costo accessibile, ma dovrà affrontare la sfida di mantenere un equilibrio tra costo e capacità.