Google sta riorganizzando il proprio gruppo dedicato all’AI coding, trasformandolo da una struttura concentrata soprattutto sulle capacità di programmazione in un’unità più ampia dedicata al mid-training dei modelli. Il cambiamento riguarda una fase intermedia dello sviluppo di un modello linguistico, collocata tra il pretraining su grandi quantità di dati eterogenei e il post-training finalizzato ad affinare comportamento, sicurezza, istruzioni e qualità dell’interazione.
L’obiettivo è usare il mid-training per sviluppare capacità operative più profonde in domini ad alto valore applicativo, a partire dal coding ma senza limitarvisi. La stessa infrastruttura di apprendimento dovrebbe infatti contribuire a rendere i modelli più efficaci anche nella produzione di documenti, presentazioni, contenuti strutturati e attività d’ufficio che richiedono pianificazione, uso coerente del contesto e gestione di task composti da più passaggi.
La distinzione tra mid-training e post-training modifica anche la distribuzione delle responsabilità interne. Il miglioramento delle competenze fondamentali del modello, come ragionamento sul codice, comprensione di repository, generazione di funzioni, correzione di errori e completamento di workflow software, viene riportato nella fase di addestramento specializzato. Il post-training dovrebbe invece concentrarsi maggiormente sul modo in cui queste capacità vengono esposte all’utente, quindi sulla qualità delle risposte, sull’uso degli strumenti, sulla gestione delle istruzioni e sull’esperienza dei prodotti basati su Gemini.
La scelta segnala quanto il coding sia ormai considerato un indicatore centrale delle capacità generaliste di un modello. Scrivere codice non richiede soltanto la conoscenza della sintassi di un linguaggio, ma implica analisi di requisiti, decomposizione di problemi, verifica della coerenza tra componenti, recupero di informazioni tecniche e correzione iterativa degli errori. Per questo, un modello addestrato in modo più mirato su attività di sviluppo può trasferire parte di queste competenze anche verso agenti destinati a compiti professionali più ampi.
La riorganizzazione arriva in una fase in cui i principali laboratori di AI stanno trattando gli strumenti per sviluppatori come piattaforme agentiche. I sistemi non vengono più progettati soltanto per suggerire righe di codice in un editor, ma per esplorare basi di codice, interpretare ticket, modificare file, eseguire test, utilizzare strumenti esterni e mantenere continuità operativa durante procedure articolate. In questa prospettiva, il vantaggio non dipende unicamente dal modello di base, ma dalla qualità dei dati specialistici, dagli ambienti di valutazione e dalla capacità di addestrare il sistema a lavorare in modo affidabile su sequenze operative reali.
Per Google, l’estensione del team dal coding al mid-training rappresenta quindi un intervento sull’architettura organizzativa dello sviluppo dei modelli. La programmazione diventa il primo banco di prova di una strategia più ampia, orientata a rendere le capacità agentiche parte strutturale dell’addestramento e non soltanto una funzione aggiunta nella fase finale del prodotto.
