Lo sviluppo di sistemi capaci di progettare, testare e migliorare autonomamente modelli di intelligenza artificiale rappresenta uno dei passaggi più rilevanti nell’evoluzione recente del settore. In questo contesto si inserisce ASI-Evolve, un framework sviluppato dal SII-GAIR, progettato per automatizzare l’intero processo iterativo che tradizionalmente definisce la ricerca AI: formulazione delle ipotesi, progettazione, sperimentazione e analisi dei risultati.
Il principio su cui si basa il sistema è quello di trasformare un processo storicamente guidato dall’intuizione umana in un ciclo computazionale continuo, capace di esplorare in modo sistematico spazi di progettazione estremamente ampi. Nella ricerca tradizionale, infatti, i limiti principali derivano dal tempo necessario per progettare esperimenti, dall’elevato costo computazionale e dalla difficoltà di accumulare e riutilizzare la conoscenza prodotta. ASI-Evolve affronta questi vincoli introducendo una struttura ciclica completamente automatizzata, in cui ogni iterazione alimenta la successiva attraverso un meccanismo di apprendimento progressivo.
Il framework è costruito come un ecosistema composto da più moduli interconnessi. Il primo elemento centrale è la cosiddetta base cognitiva, un repository strutturato che raccoglie conoscenze provenienti da articoli scientifici, dataset e risultati sperimentali precedenti. Questa componente non svolge un ruolo passivo, ma guida attivamente il processo di ricerca, orientando il sistema verso aree dello spazio progettuale considerate promettenti. In questo modo, l’esplorazione non avviene in modo casuale, ma sfrutta una forma di memoria strutturata che consente di evitare percorsi già inefficaci e di concentrarsi su direzioni ad alto potenziale.
Accanto alla base cognitiva opera un modulo di analisi, responsabile dell’interpretazione dei risultati sperimentali. Questo componente trasforma output grezzi in informazioni strutturate, sintetizzando pattern, anomalie e correlazioni che vengono reinserite nel sistema. Il risultato è un processo di apprendimento cumulativo, in cui ogni ciclo non solo produce nuovi modelli, ma arricchisce la capacità del sistema di prendere decisioni più informate nelle iterazioni successive.
Il cuore operativo del framework è costituito da agenti specializzati che replicano le funzioni tipiche di un team di ricerca. Alcuni moduli generano nuove ipotesi progettuali, altri eseguono esperimenti concreti, mentre ulteriori componenti gestiscono la valutazione e la memorizzazione dei risultati. L’interazione tra questi elementi avviene attraverso un flusso continuo: il sistema seleziona contesti rilevanti dalla base dati, genera candidati progettuali, li sottopone a test entro vincoli temporali definiti e analizza i risultati per aggiornare il proprio stato interno.
Un aspetto particolarmente rilevante riguarda l’efficienza computazionale. Il framework integra meccanismi di rilevamento precoce degli errori durante l’esecuzione degli esperimenti, riducendo l’utilizzo non necessario di risorse come le GPU. Questo consente di mantenere elevata la velocità di iterazione, elemento fondamentale per un sistema che basa la propria efficacia sulla capacità di eseguire migliaia di cicli in tempi ridotti.
I risultati ottenuti evidenziano il potenziale di questo approccio. Nel corso di oltre 1.700 iterazioni, ASI-Evolve è riuscito a identificare più di 100 nuove architetture nel campo dell’attenzione lineare, un ambito cruciale per l’efficienza dei modelli di deep learning. Questo tipo di risultato non si limita a miglioramenti incrementali, ma dimostra la capacità del sistema di esplorare soluzioni non immediatamente evidenti per i ricercatori umani.
Particolarmente significativo è il lavoro svolto sull’ottimizzazione dei meccanismi di attenzione. Il sistema ha trasformato strutture complesse basate su Softmax in alternative lineari più efficienti dal punto di vista computazionale, ottenendo prestazioni superiori rispetto a modelli progettati manualmente. Questo risultato è stato raggiunto in pochi giorni, un tempo drasticamente inferiore rispetto ai mesi normalmente richiesti per iterazioni di progettazione e validazione condotte da team umani.
Le prestazioni quantitative confermano l’efficacia del framework. Miglioramenti medi nei benchmark di preelaborazione dei dati indicano una capacità di ottimizzazione generalizzata, mentre incrementi significativi nei test come MMLU evidenziano un progresso nella qualità dell’intelligenza di base dei modelli. Anche nel campo dell’apprendimento per rinforzo, il sistema ha superato algoritmi consolidati come Group Relative Policy Optimization, dimostrando la capacità di innovare oltre le soluzioni esistenti.
