Microsoft Research ha annunciato SkillOpt, un nuovo framework open source progettato per migliorare le prestazioni degli agenti basati su modelli linguistici attraverso l’ottimizzazione delle loro competenze operative senza intervenire sui pesi del modello sottostante. L’approccio introduce un cambiamento significativo rispetto alle tradizionali tecniche di fine-tuning, spostando il processo di apprendimento dall’architettura neurale verso un livello esterno rappresentato da documenti di competenze espressi in linguaggio naturale.
Il sistema considera le cosiddette “skill” come uno stato addestrabile dell’agente. In pratica, invece di aggiornare miliardi di parametri interni di un modello, SkillOpt lavora su un documento testuale che descrive procedure operative, strategie di utilizzo degli strumenti, modalità di verifica dei risultati, istruzioni di ragionamento e linee guida per l’esecuzione dei compiti. Questo documento diventa l’elemento che viene progressivamente migliorato attraverso un processo iterativo di apprendimento.
L’architettura prevede la presenza di un modello ottimizzatore separato che analizza le esecuzioni dell’agente, identifica errori ricorrenti e propone modifiche controllate sotto forma di aggiunte, eliminazioni o sostituzioni di parti del documento delle competenze. Ogni modifica viene sottoposta a un meccanismo di validazione su dati separati e viene accettata esclusivamente quando produce un miglioramento misurabile delle prestazioni. Questo approccio introduce concetti tipici dell’addestramento neurale, come cicli di ottimizzazione, aggiornamenti progressivi e controllo dell’overfitting, ma applicati direttamente a istruzioni testuali invece che a matrici di pesi numerici.
Uno degli elementi distintivi di SkillOpt è l’assenza di costi aggiuntivi durante la fase di inferenza. Una volta completato il processo di ottimizzazione, l’agente utilizza semplicemente la versione aggiornata del documento delle competenze, senza richiedere chiamate supplementari a modelli esterni o procedure di elaborazione aggiuntive. Il risultato è una strategia di miglioramento che può essere distribuita come un semplice file testuale e riutilizzata su differenti ambienti operativi.
Secondo i risultati pubblicati dal team di ricerca, SkillOpt è stato valutato su sei benchmark, sette modelli differenti e tre modalità di esecuzione, comprese configurazioni agentiche basate su Codex e Claude Code. Il framework ha ottenuto prestazioni migliori o equivalenti ai migliori concorrenti in tutte le combinazioni testate. Nei test effettuati con GPT-5.5, Microsoft riporta incrementi medi di 23,5 punti percentuali nelle configurazioni direct chat, 24,8 punti negli ambienti Codex e 19,1 punti negli scenari Claude Code rispetto alle versioni prive di skill ottimizzate.
Un ulteriore aspetto rilevante riguarda la portabilità delle competenze generate. Gli esperimenti mostrano che le skill ottimizzate possono essere trasferite tra modelli differenti e tra diversi framework di esecuzione mantenendo parte dei benefici ottenuti durante l’addestramento. Questo consente di trattare le competenze operative come asset indipendenti dal modello, facilitandone la distribuzione, il versionamento e il riutilizzo all’interno di ecosistemi di agenti eterogenei.
Con SkillOpt, Microsoft propone quindi una nuova direzione per l’evoluzione degli agenti AI: invece di aumentare continuamente la dimensione dei modelli o ricorrere a costose procedure di fine-tuning, il miglioramento delle capacità operative viene ottenuto attraverso l’ottimizzazione sistematica delle istruzioni e delle strategie che guidano il comportamento dell’agente durante l’esecuzione dei compiti.
