Il lancio della serie Laguna da parte di Poolside segna un’evoluzione significativa nel campo dei modelli di linguaggio orientati alla programmazione, spostando l’obiettivo dalla semplice generazione di snippet alla creazione di veri e propri agenti autonomi capaci di operare su orizzonti temporali estesi. Al centro di questa release troviamo i modelli Laguna M.1 e Laguna XS.2, i quali non si limitano a richiamare strumenti predefiniti, ma sono stati progettati per generare codice in modo indipendente, gestire l’elaborazione parallela di task complessi e configurare autonomamente nuovi sistemi di sviluppo. Questa capacità trasforma l’IA da assistente passivo a ingegnere operativo, in grado di pianificare ed eseguire cicli di correzione degli errori senza la supervisione costante dell’utente.
Sotto il profilo strettamente architettonico, Laguna M.1 si presenta come un modello Mixture-of-Experts (MoE) da 225 miliardi di parametri, addestrato interamente da zero su un corpus massiccio di 30 trilioni di token. L’approccio MoE permette al sistema di attivare solo una frazione dei suoi parametri per ogni specifico input, ottimizzando il throughput e la specializzazione durante la risoluzione di problemi di ingegneria del software di alto livello. Per i contesti che richiedono maggiore agilità o esecuzione in locale, il modello Laguna XS.2 da 33 miliardi di parametri offre prestazioni paragonabili a sistemi di scala superiore, pur essendo rilasciato sotto licenza Apache 2.0. Questo modello open-weight è ottimizzato per funzionare in ambienti isolati, garantendo agli sviluppatori il pieno controllo sui pesi e sulla distribuzione del codice senza dipendere da connessioni internet persistenti.
L’efficienza di addestramento della serie Laguna è supportata da innovazioni metodologiche nei processi di cura dei dati e di ottimizzazione. Poolside ha implementato “Muon”, un ottimizzatore proprietario che ha permesso di accelerare la velocità di apprendimento del quindici per cento rispetto agli standard precedenti, migliorando la convergenza su dataset eterogenei. La strategia di alimentazione del modello ha integrato un mix sofisticato di dati web e dati sintetici, questi ultimi pari a circa il tredici per cento del totale, selezionati tramite criteri che bilanciano qualità e diversità per prevenire il collasso del modello e migliorare la capacità di generalizzazione in scenari di coding rari. Un pilastro fondamentale del processo è l’Apprendimento per Rinforzo (RL) asincrono, addestrato all’interno di ambienti di test che simulano fedelmente i flussi di lavoro reali, consentendo al modello di stabilizzare le proprie prestazioni anche durante attività che richiedono manipolazioni prolungate di file system e repository complessi.
Per supportare l’operatività di questi agenti, Poolside ha presentato un ecosistema integrato composto dal framework “Pool” e dall’ambiente di sviluppo “Shimmer”. Pool funge da strato di persistenza per gli agenti, preservando lo stato della memoria e del file system in ogni istante del processo; questa caratteristica tecnica permette all’agente di riprendere esattamente da dove si era interrotto in caso di interruzioni o pause lunghe, una funzione critica per i compiti di sviluppo software che durano ore o giorni. Shimmer, invece, fornisce l’ambiente virtuale di esecuzione, permettendo di scrivere, compilare ed eseguire codice sia su web che su dispositivi mobili in modo istantaneo. Questo binomio tecnologico permette alla serie Laguna di agire come un “peer engineer”, capace non solo di suggerire soluzioni, ma di implementarle attivamente attraverso la lettura dei file, l’esecuzione di test unitari e la modifica iterativa del codice fino al raggiungimento del risultato desiderato.
