Immagine AI

Google ha rinviato a luglio il rilascio di Gemini 3.5 Pro, il modello di punta della nuova famiglia Gemini 3.5 destinato ai compiti agentici, al coding e ai workflow complessi a lunga durata. Durante Google I/O 2026 l’azienda aveva indicato una disponibilità entro giugno, ma il modello resta ancora in fase di test e affinamento prima della distribuzione più ampia attraverso i prodotti Google e le API per sviluppatori.

Gemini 3.5 Pro è progettato per affrontare attività nelle quali un modello non deve limitarsi a generare una risposta, ma deve pianificare più passaggi, mantenere il contesto operativo, usare strumenti esterni, verificare risultati intermedi e completare procedure che possono durare a lungo. Google colloca il modello nella stessa strategia che ha portato Gemini 3.5 Flash all’interno di Antigravity, della Gemini API, di Google AI Studio, Android Studio e della piattaforma Gemini Enterprise Agent.

Il ritardo riguarda soprattutto la raccolta di feedback da tester selezionati e la regolazione del comportamento del modello prima del rilascio generale. Gemini 3.5 Pro è già utilizzato internamente da Google e, secondo le informazioni disponibili, viene provato anche da alcuni utenti di Antigravity e tramite LM Arena. In questa fase, i test servono a osservare come il modello si comporta su richieste reali, task di sviluppo software, flussi agentici e sequenze operative nelle quali errori di pianificazione, uso eccessivo di strumenti o gestione inefficiente del contesto possono avere effetti rilevanti sul costo e sull’affidabilità del risultato.

Uno dei punti emersi riguarda il consumo dei token. Nelle applicazioni agentiche, il costo non dipende solo dal prompt iniziale o dalla risposta finale, ma dall’intera catena di chiamate necessarie per completare il compito. Un agente può leggere documentazione, interrogare tool, generare codice, eseguire controlli, correggere errori e ripetere parti del workflow. Se ogni passaggio utilizza troppo contesto o produce output non necessario, il consumo cresce rapidamente, soprattutto nei task a lunga durata o nei sistemi che coordinano più subagenti.

Google ha già raccolto indicazioni operative attraverso Gemini 3.5 Flash, il modello più veloce della famiglia, disponibile dal 19 maggio 2026. Flash è stato introdotto come modello per agenti e coding con supporto a workflow multi-step, function calling, strumenti integrati e orchestrazione di subagenti tramite Antigravity. Google indica per Gemini 3.5 Flash risultati di 76,2% su Terminal-Bench 2.1, 83,6% su MCP Atlas e 1656 Elo su GDPval-AA, benchmark utilizzati per valutare capacità di coding, uso di strumenti e task professionali complessi.

Il modello Flash ha inoltre ricevuto il supporto nativo al computer use, cioè la capacità di osservare un’interfaccia, ragionare sul suo stato e interagire con browser, desktop e applicazioni mobili. Google ha integrato questa funzione direttamente nel modello invece di mantenere un sistema separato, consentendo agli sviluppatori di costruire agenti che possono operare in ambienti software reali. Per questi workflow, Google ha introdotto anche funzioni di sicurezza che richiedono conferma dell’utente per azioni sensibili o irreversibili e che possono interrompere il task quando viene rilevata una prompt injection indiretta.

Gemini 3.5 Pro dovrebbe rappresentare il livello più avanzato della stessa famiglia, con una maggiore attenzione alla pianificazione di attività prolungate, alla gestione di agenti e alla qualità del ragionamento nei flussi di sviluppo e automazione. Il rinvio non modifica la disponibilità di Gemini 3.5 Flash, già distribuito nei prodotti Google, ma sposta il rilascio del modello Pro per consentire ulteriori regolazioni sulle prestazioni reali, sull’efficienza nell’uso dei token e sulla stabilità nei compiti agentici.

Google non ha pubblicato specifiche definitive, prezzi API, benchmark completi o una data precisa di rilascio per Gemini 3.5 Pro. Il modello resta quindi in una fase di test controllato, mentre l’azienda utilizza i dati raccolti da Gemini 3.5 Flash e dagli ambienti Antigravity per perfezionare il comportamento del sistema prima della disponibilità generale.

Di Fantasy