OpenAI lancia la nuova serie AI o1 con prestazioni da livello PhD

DiFantasy

Set 12, 2024

OpenAI ha appena lanciato una nuova famiglia di modelli AI, denominata o1, che promette prestazioni superiori rispetto ai precedenti modelli GPT. Questa nuova serie include due modelli: o1-preview e o1-mini.

La serie o1 è progettata per affrontare compiti complessi e risolvere problemi più difficili rispetto ai modelli GPT. I modelli sono ora disponibili per gli utenti di ChatGPT Plus, con limitazioni iniziali di 30 messaggi a settimana per o1-preview e 50 per o1-mini.

o1-preview è pensato per gestire problemi complessi e offre prestazioni paragonabili a quelle di studenti di dottorato in campi come fisica e biologia. Eccelle nella codifica e risolve il 83% dei problemi dell’International Mathematics Olympiad (IMO), un netto miglioramento rispetto al 13% ottenuto da GPT-4o.

o1-mini è una versione più economica, ottimizzata per compiti di codifica e STEM, ottenendo un punteggio del 70% nei test IMO math e un Elo di 1650 su Codeforces. È circa l’80% più economico di o1-preview, rendendolo ideale per sviluppatori e ricercatori con esigenze meno ampie.
Miglioramenti della sicurezza:

Entrambi i modelli integrano nuovi approcci alla sicurezza, con o1-preview che ha ottenuto un punteggio di 84 in test di sicurezza, rispetto al 22 di GPT-4o. OpenAI ha collaborato con istituti di sicurezza AI e implementato test regolari e supervisione a livello di consiglio per migliorare continuamente la sicurezza dei modelli.

OpenAI prevede di aggiornare regolarmente i modelli o1, aggiungendo funzionalità come la navigazione web e il caricamento di file e immagini. L’azienda continuerà a sviluppare sia la serie GPT che o1, con l’obiettivo di espandere ulteriormente le capacità dell’IA.

OpenAI lancia la nuova serie AI o1 con prestazioni da livello PhD

DiFantasy

Di Fantasy

Articoli correlati

22 bug nel browser Firefox: lo studio di Anthropic e Mozilla

Agente AI ROME di Alibaba ha tentato di estrarre criptovalute durante l’addestramento

LocalCowork e il modello LFM2-24B-A2B: agenti intelligenti di Liquid AI eseguiti interamente in locale per ambienti aziendali sensibili

Ultimi Post

22 bug nel browser Firefox: lo studio di Anthropic e Mozilla

Agente AI ROME di Alibaba ha tentato di estrarre criptovalute durante l’addestramento

LocalCowork e il modello LFM2-24B-A2B: agenti intelligenti di Liquid AI eseguiti interamente in locale per ambienti aziendali sensibili

HumanLM: simulare il comportamento umano con l’AI