Due mesi fa, OpenAI ha lanciato GPT-4o, il suo modello di intelligenza artificiale più avanzato, capace di gestire input e output multimodali (testo, immagine, audio e video) senza bisogno di altri modelli di supporto.
Al momento del rilascio, GPT-4o era il modello di IA più potente secondo i benchmark di terze parti, ma è stato rapidamente superato da Claude 3.5 Sonnet di Anthropic. Da allora, i due modelli sono in competizione.
Oggi, OpenAI presenta GPT-4o mini, una versione più piccola e conveniente del modello originale. Questo modello costa solo 0,15 $ per ogni milione di token inseriti e 0,60 $ per ogni milione di token ricevuti, contro i 5,00 $ e 15 $ rispettivamente di GPT-4o.
I token sono unità semantiche che rappresentano parole, numeri e altri dati in un modello linguistico. Sebbene OpenAI non abbia rivelato le dimensioni precise di GPT-4o mini, il termine “mini” suggerisce che sia più piccolo del modello originale.
Olivier Godement, responsabile dei prodotti API di OpenAI, ha dichiarato che GPT-4o mini è particolarmente utile per aziende e sviluppatori che necessitano di molte chiamate API, come agenti di supporto clienti o finanziari, riducendo significativamente i costi operativi.
Il lancio di GPT-4o mini precede l’uscita del modello Llama 3 di Meta, previsto per la prossima settimana, e mira a consolidare la posizione di OpenAI come leader nel settore dell’intelligenza artificiale aziendale.
GPT-4o mini è più economico del 60% rispetto a GPT-3.5 Turbo e altrettanto veloce, con una velocità di circa 67 token al secondo. È considerato il successore diretto di GPT-3.5 Turbo, ma più capace, potendo gestire input sia di testo che visivi.
In futuro, GPT-4o mini sarà in grado di generare anche output multimodali (immagini, audio e video), ma per ora supporta solo input di testo e immagini fisse.
GPT-4o mini ha superato GPT-3.5 Turbo e altri modelli simili in vari benchmark. Ad esempio, ha ottenuto un punteggio dell’82,0% nel benchmark Massive Multitask Language Understanding (MMLU), superando Gemini Flash di Google (77,9%) e Claude Haiku di Anthropic (73,8%).
Questo autunno, GPT-4o mini sarà disponibile tramite Apple Intelligence per dispositivi mobili e desktop Mac, in concomitanza con il rilascio di iOS 18. Tuttavia, continuerà a essere eseguito sui server cloud di OpenAI.
Da oggi, GPT-4o mini sostituirà GPT-3.5 Turbo per gli abbonati paganti di ChatGPT, ma senza riduzione dei prezzi degli abbonamenti. Gli utenti avranno accesso a un modello più nuovo, veloce e potente rispetto a GPT-3.5 Turbo.
OpenAI continuerà a supportare GPT-3.5 Turbo nelle sue API per non obbligare gli sviluppatori a passare subito al nuovo modello. Tuttavia, molti potrebbero farlo rapidamente grazie ai costi ridotti e alle migliori prestazioni di GPT-4o mini.
Alcuni sviluppatori, come Ramp e Superhuman, stanno già testando GPT-4o mini e riportano risultati eccellenti.
Nonostante GPT-4o mini offra significativi risparmi e alte prestazioni, OpenAI ritiene che per applicazioni complesse e ad alta intensità di calcolo, GPT-4o completo rimanga la scelta migliore.