Immagine AI

Epoch AI ha pubblicato una nuova analisi sullo stato dell’intelligenza artificiale che misura il divario prestazionale tra i migliori modelli open-weight e i principali modelli proprietari a pesi chiusi. Secondo lo studio, i sistemi open-weight più avanzati continuano a inseguire i leader del settore, con un ritardo medio stimato di circa quattro mesi rispetto alle soluzioni closed-weight attualmente disponibili.

La valutazione è stata realizzata utilizzando l’Epoch Capability Index (ECI), un indicatore sviluppato dall’organizzazione per sintetizzare in un unico punteggio i risultati ottenuti dai modelli in una vasta gamma di benchmark e test di capacità. L’obiettivo dell’indice è fornire una misura aggregata che consenta di confrontare sistemi differenti attraverso una metodologia uniforme, superando i limiti dei singoli benchmark specialistici.

Secondo i risultati pubblicati, il modello con il punteggio più elevato risulta GPT-5.5 di OpenAI, che ha ottenuto un valore ECI pari a 159. Nel segmento open-weight, il modello con la valutazione più alta è Kimi K2.6 di Moonshot AI, che raggiunge un punteggio di 152. La differenza tra le due categorie corrisponde quindi a circa otto punti ECI.

Per rendere più comprensibile questa distanza, Epoch AI traduce il divario in termini temporali. La metodologia consiste nell’identificare il momento in cui un modello proprietario ha raggiunto prestazioni equivalenti a quelle del miglior modello open-weight disponibile oggi. Applicando questo criterio, il livello prestazionale raggiunto attualmente da Kimi K2.6 corrisponderebbe approssimativamente a quello ottenuto dai modelli closed-weight di punta circa quattro mesi fa.

Lo studio evidenzia inoltre che il divario è leggermente aumentato rispetto alle analisi precedenti. Nella valutazione pubblicata alcuni mesi fa, la distanza stimata era pari a circa tre mesi. L’aggiornamento più recente suggerisce quindi che i modelli proprietari abbiano accelerato il proprio ritmo di miglioramento leggermente più rapidamente rispetto alle principali iniziative open-weight.

Per evitare che piccole variazioni nei risultati dei benchmark influenzino eccessivamente le conclusioni, Epoch AI ha applicato tecniche statistiche che simulano numerose prove virtuali utilizzando dati rimescolati e campionamenti ripetuti. Questo approccio permette di determinare con maggiore affidabilità quando due modelli possano essere considerati statisticamente equivalenti dal punto di vista delle prestazioni.

Secondo i ricercatori, adottando criteri ancora più rigorosi per definire l’equivalenza tra modelli aperti e chiusi, il ritardo potrebbe risultare persino superiore, arrivando fino a circa sei mesi. Ciò evidenzia quanto la stima del gap dipenda anche dalla metodologia utilizzata per confrontare sistemi che spesso mostrano punti di forza differenti a seconda del tipo di attività considerata.

Uno degli aspetti più interessanti dell’analisi riguarda la velocità con cui i modelli di fascia alta stanno evolvendo. Negli ultimi mesi OpenAI e Anthropic hanno aumentato sensibilmente la frequenza degli aggiornamenti delle rispettive famiglie di modelli, introducendo nuove versioni a intervalli molto più brevi rispetto al passato. Questo ritmo di rilascio ha contribuito ad accelerare il miglioramento delle prestazioni dei sistemi proprietari e ha reso più difficile per l’ecosistema open-weight mantenere una perfetta convergenza con i leader del mercato.

Lo studio sottolinea inoltre che le valutazioni si basano esclusivamente sui modelli pubblicamente disponibili. Questo significa che eventuali sistemi interni non ancora distribuiti commercialmente non sono stati inclusi nell’analisi. Di conseguenza, il divario effettivo tra ricerca proprietaria e modelli open-weight potrebbe essere diverso qualora le aziende dispongano già di tecnologie più avanzate non ancora rese accessibili al pubblico.

Nonostante ciò, la distanza rilevata rimane relativamente contenuta rispetto agli standard storici del settore. Un ritardo di pochi mesi indica che la comunità open-weight continua a progredire rapidamente e a mantenere una forte capacità di recupero rispetto ai modelli sviluppati dalle principali aziende dell’intelligenza artificiale.

L’analisi di Epoch AI evidenzia quindi una situazione caratterizzata da due tendenze parallele. Da un lato i modelli closed-weight continuano a mantenere la leadership nelle prestazioni aggregate e stanno aumentando la velocità di evoluzione. Dall’altro, l’ecosistema open-weight rimane sufficientemente vicino da riuscire a ridurre in tempi relativamente brevi gran parte del vantaggio accumulato dai sistemi proprietari, mantenendo aperta la competizione tecnologica tra i due approcci.

Di Fantasy