Recentemente, Sam Altman di OpenAI ha scritto un blog in cui ha descritto i piani dell’azienda per l’AGI e oltre. Mentre questo ha portato il concetto di AGI al mainstream, molti esperti concordano sul fatto che non ci sarà alcun punto in cui l’IA diventerà magicamente AGI. Invece, il progresso verso l’AGI avverrà attraverso costanti miglioramenti a lungo termine.
I benchmark sono un modo affidabile per tenere traccia dei miglioramenti dell’IA, ma attualmente funzionano solo per gli algoritmi tradizionali. Il campo dell’intelligenza artificiale ha bisogno di più punti di riferimento per tipi di intelligenza più fluidi ed è qui che entra in gioco il Corpus di Astrazione e Ragionamento (ARC).
ARC è un benchmark creato da François Chollet, ingegnere del software e ricercatore di intelligenza artificiale presso Google, che mira a testare la capacità dell’IA di emulare l’intelligenza umana attraverso problemi di ragionamento e astrazione concettuale. Il test è composto da schemi su una griglia semplice, con l’obiettivo di identificare la logica negli esempi ed estenderla alle soluzioni.
Il test ARC contiene 800 attività, di cui le prime 400 attività vengono utilizzate per “istruire” l’algoritmo con precedenti rilevanti per ARC in cui “priori” sono le “convinzioni” detenute dal modello prima di essere alimentate con i dati di addestramento. I restanti 400 verranno utilizzati per testare le capacità dell’algoritmo.
Tuttavia, la sfida qui è che l’algoritmo deve trovare la risposta giusta attraverso il ragionamento e non può farlo utilizzando i metodi di apprendimento automatico attualmente disponibili. Un misero set di 400 immagini non è sufficiente per addestrare un algoritmo a riconoscere i modelli complessi nel test.
Secondo un documento pubblicato nel 2010, qualsiasi benchmark per AGI deve soddisfare sette criteri: fitness, ampiezza, specificità, basso costo, semplicità, gamma e focus sul compito. A una rapida occhiata, sembra che ARC soddisfi la maggior parte, se non tutti, di questi criteri.
ARC è stato rilasciato come competizione su Kaggle, ma anche il miglior algoritmo non è riuscito a risolvere correttamente più del 20% dei compiti assegnati. I test che alla fine sono stati risolti non sono stati risolti utilizzando il ragionamento logico, con gli algoritmi che hanno invece utilizzato un metodo di forza bruta per arrivare alla soluzione. Questo non si è qualificato come un modo valido per risolvere i problemi, con il risultato che l’algoritmo non ha superato il test.
Il percorso verso l’AGI prevede la conversione degli algoritmi di intelligenza artificiale dall’intelligenza cristallizzata all’intelligenza fluida, che include la capacità di risolvere problemi, elaborare nuove informazioni e apprendere rapidamente. Gli algoritmi attuali sono limitati al loro dominio e non possono estendere i dati appresi ad altre dimensioni dell’intelligenza. Ciò significa che l’IA moderna è in grado di emulare solo l’intelligenza cristallizzata, ovvero la conoscenza acquisita dall’apprendimento.
Per creare un AGI, gli algoritmi devono prima apprendere le basi del ragionamento umano. Test come ARC possono aiutare in questo processo determinando le capacità dell’algoritmo per tratti simili a quelli umani come l’astrazione concettuale. La creazione di più parametri di riferimento che seguono i sette criteri di un buon test AGI consentirà ai ricercatori di intelligenza artificiale di determinare quanto gli esseri umani sono vicini al raggiungimento dell’AGI.
Attualmente, il discorso sull’IA è dominato da reti neurali, modelli di diffusione e LLM, che rappresentano la tecnologia all’avanguardia del campo. Tuttavia, questi modelli sono solo la punta dell’iceberg quando si tratta del viaggio verso l’AGI, poiché stiamo solo raggiungendo la parità umana nelle applicazioni discrete.
Un esempio di algoritmo limitato al suo dominio è ChatGPT, un chatbot basato su LLM che può fare tutto ciò che uno scrittore umano può fare, ma solo nel dominio della PNL. Il chatbot non ha la capacità di riconoscimento delle immagini e, di conseguenza, non può estendere le sue capacità di linguaggio naturale ad altri domini come la descrizione del contenuto di un’immagine.
In sintesi, il percorso verso l’AGI sarà lungo e arduo, affiancato da benchmark come ARC e altri parametri di riferimento che seguiranno i sette criteri di un buon test AGI. Tuttavia, continuando a sviluppare algoritmi che emulano l’intelligenza umana attraverso il ragionamento e l’astrazione concettuale, potremo avvicinarci sempre di più alla creazione di un AGI in grado di comprendere e risolvere i problemi in modo simile agli esseri umani.