OpenAI ha apportato un importante aggiornamento a “GPT-4 Turbo” per i suoi utenti premium. Risolvendo il recente problema di lentezza riscontrato con “ChatGPT”, hanno anche condiviso risultati di benchmark che dimostrano come questo modello superi sia “Claude 3” di Antropic che l’ultimo modello Gemini di Google.

TechCrunch ha riportato che OpenAI ha rilasciato un aggiornamento per GPT-4 Turbo, destinato agli utenti premium di ChatGPT, tra cui ChatGPT Plus e gli utenti Teams ed Enterprise.

Le modifiche includono risposte più dirette, concise e in un linguaggio più colloquiale quando si interagisce con ChatGPT.

L’ultima versione, denominata “gpt-4-turbo-2024-04-09”, è stata addestrata su dati pubblici fino a dicembre 2023, a differenza delle versioni precedenti.

Inoltre, OpenAI ha rilasciato la versione più recente del benchmark tramite GitHub.

Le nuove metriche includono:

  • MMLU (Misura della comprensione linguistica in multitasking massiccio)
  • MATH (Misura della risoluzione di problemi matematici)
  • GPQA (Benchmark di domande e risposte di prova di Google a livello di laurea)
  • DROP (Benchmark di comprensione della lettura con ragionamenti sui paragrafi)
  • MGSM (Benchmark multilingue di matematica della scuola elementare)
  • Human Eval (Valutazione del codice), superando sia la versione precedente di GPT-4 che i modelli “Claude 3 Opus” di Antropic e “Gemini Ultra 1.0” e “Pro 1.5” di Google.

In precedenza, OpenAI aveva ricevuto critiche per la “pigrizia”, ​​in cui le prestazioni di ChatGPT erano diminuite. Tuttavia, con questo aggiornamento, si prevede che il problema sia risolto.

Mentre OpenAI si concentra sulle prossime versioni come l’intelligenza artificiale per la creazione di video “Sora” e GPT-5, Google e Antropic hanno annunciato nuovi modelli che superano GPT-4 nei benchmark. Pertanto, OpenAI deve mantenere prestazioni elevate fino al rilascio di GPT-5.

In risposta a ciò, il 9, poco prima del rilascio di questa nuova versione, OpenAI ha ufficialmente rilasciato l’API “GPT-4 Turbo”, incluso il modello di visione, e ha dichiarato: “Continuiamo a investire nel miglioramento dei nostri modelli e non vediamo l’ora di sentire il tuo feedback”.

Di Fantasy