Un nuovo studio ha rivelato un trend interessante nel campo dell’intelligenza artificiale: la quantità di lavoro che i sistemi AI sono in grado di gestire raddoppia ogni sette mesi. Se questa tendenza continua a crescere, tra pochi anni l’intelligenza artificiale sarà in grado di completare compiti che a un essere umano richiederebbero un mese di tempo.

METR, un’organizzazione non-profit statunitense, ha pubblicato un documento intitolato “Misurazione della capacità dell’intelligenza artificiale di completare compiti lunghi”, che quantifica le capacità dell’intelligenza artificiale in relazione a quelle umane. In particolare, è stato calcolato quanto tempo un essere umano impiegherebbe per completare un compito che un modello di intelligenza artificiale può svolgere con successo al 50%. In altre parole, lo studio mostra quanto bene i modelli di IA riescano a gestire compiti complessi che, tradizionalmente, richiedono giorni o settimane di lavoro da parte di una persona.

Per realizzare questa ricerca, sono stati selezionati oltre 170 compiti reali, provenienti da settori come la programmazione, la sicurezza informatica, il ragionamento generale e l’apprendimento automatico. I ricercatori hanno misurato il tempo che impiegano programmatori esperti per completare questi compiti e successivamente hanno testato le prestazioni di vari modelli di intelligenza artificiale. I risultati hanno mostrato che, nel 2019, ‘GPT-2’ di OpenAI non era in grado di completare nemmeno i compiti più semplici che un esperto umano riusciva a fare in meno di un minuto.

Nel corso degli anni, però, le capacità dei modelli di intelligenza artificiale sono migliorate in modo significativo. Analizzando 13 modelli principali di IA, dal 2019 a oggi, i ricercatori hanno notato che le prestazioni dei modelli raddoppiavano ogni sette mesi circa. Entro il 2024, si prevede che il ritmo di miglioramento acceleri ulteriormente, con i modelli più recenti in grado di raddoppiare le loro capacità ogni tre mesi.

Un esempio concreto di questo miglioramento esponenziale è “Claude 3.7 Sonnet”, il modello di IA sviluppato da Anthropic, che nel febbraio 2025 è stato in grado di completare il 50% di un compito che richiederebbe a una persona 59 minuti di lavoro. Questo progresso è il risultato dei continui miglioramenti nelle capacità degli agenti di IA, che sono sempre più efficienti nel gestire compiti complessi.

Secondo le stime di METR, se questo ritmo di progresso continua, entro il 2029 l’intelligenza artificiale sarà in grado di completare attività che a un essere umano richiederebbero un mese di lavoro. In pratica, ciò significa che l’AI potrebbe essere in grado di condurre uno studio accademico della durata di un mese o addirittura avviare una startup, tutto in tempi molto più brevi rispetto a quanto ci vuole a un essere umano.

Un altro aspetto interessante dello studio riguarda l’influenza dell’aumento del tasso di successo delle attività. Se la percentuale di successo salisse all’80%, il tempo necessario per completare i compiti si ridurrebbe significativamente. Tuttavia, il trend generale mostra che l’IA è sempre più capace di gestire attività complesse, non solo in termini di grandezze fisiche, ma anche di miglioramento delle capacità cognitive, come il ragionamento logico, l’uso degli strumenti e la correzione degli errori.

Nonostante alcuni esperti, come Joshua Gans dell’Università di Toronto, abbiano messo in discussione la capacità di queste stime di riflettere la complessità dell’uso pratico dell’IA, lo studio di METR è stato visto come un passo avanti importante nel colmare il divario nei benchmark tra IA e esseri umani. Secondo Ben West, coautore del documento, “Anche se i modelli di IA hanno raggiunto prestazioni sovrumane in molti parametri di riferimento, il loro impatto economico è stato relativamente ridotto”, ma sottolinea anche che, con il miglioramento continuo, l’IA potrebbe essere in grado di raggiungere un livello di efficienza che permetterebbe a una macchina di completare compiti che richiedono una frazione del tempo che sarebbe necessario a un umano.

In futuro, METR prevede di continuare le sue ricerche per confrontare ulteriormente le capacità dei sistemi di IA con quelle umane, continuando a monitorare come queste tecnologie influenzano il panorama del lavoro e dell’economia.

Di Fantasy