OpenAI ha appena lanciato una nuova famiglia di modelli AI, denominata o1, che promette prestazioni superiori rispetto ai precedenti modelli GPT. Questa nuova serie include due modelli: o1-preview e o1-mini.
La serie o1 è progettata per affrontare compiti complessi e risolvere problemi più difficili rispetto ai modelli GPT. I modelli sono ora disponibili per gli utenti di ChatGPT Plus, con limitazioni iniziali di 30 messaggi a settimana per o1-preview e 50 per o1-mini.
o1-preview è pensato per gestire problemi complessi e offre prestazioni paragonabili a quelle di studenti di dottorato in campi come fisica e biologia. Eccelle nella codifica e risolve il 83% dei problemi dell’International Mathematics Olympiad (IMO), un netto miglioramento rispetto al 13% ottenuto da GPT-4o.
o1-mini è una versione più economica, ottimizzata per compiti di codifica e STEM, ottenendo un punteggio del 70% nei test IMO math e un Elo di 1650 su Codeforces. È circa l’80% più economico di o1-preview, rendendolo ideale per sviluppatori e ricercatori con esigenze meno ampie.
Miglioramenti della sicurezza:
Entrambi i modelli integrano nuovi approcci alla sicurezza, con o1-preview che ha ottenuto un punteggio di 84 in test di sicurezza, rispetto al 22 di GPT-4o. OpenAI ha collaborato con istituti di sicurezza AI e implementato test regolari e supervisione a livello di consiglio per migliorare continuamente la sicurezza dei modelli.
OpenAI prevede di aggiornare regolarmente i modelli o1, aggiungendo funzionalità come la navigazione web e il caricamento di file e immagini. L’azienda continuerà a sviluppare sia la serie GPT che o1, con l’obiettivo di espandere ulteriormente le capacità dell’IA.