Immagine AI

L’arena competitiva dell’Intelligenza Artificiale Generativa è stata scossa da una rivelazione interna a Google che suggerisce un salto di qualità nel nuovo modello di punta dell’azienda. Dirigenti e tester esterni hanno espresso la convinzione che Gemini 3 non sia solo un miglioramento incrementale, ma un vero e proprio contendente al titolo di Intelligenza Artificiale Generale (AGI), con prestazioni di agente e di ragionamento a lungo termine nettamente superiori ai competitor. Questa percezione di un’intelligenza emergente è stata riassunta in un’espressione suggestiva: “segni di vita”.

Tulsi Dorsey, Direttore Senior dei Prodotti Gemini presso Google, ha rivelato al Wall Street Journal che dopo mesi di test interni di Gemini 3, l’azienda è convinta di aver “individuato qualcosa” nel progresso dei Modelli Linguistici di Grandi Dimensioni (LLM). Questa convinzione si è manifestata durante un “controllo delle vibrazioni” condotto personalmente, nel quale Dorsey ha chiesto a Gemini 3 di scrivere in Gujarati, una lingua parlata in India ma relativamente poco rappresentata nel corpus di dati online. I risultati ottenuti sono stati così significativamente superiori rispetto ai modelli precedenti da suscitare una sensazione quasi umana nel modo in cui il modello sembrava comprendere la richiesta.

“Lo chiamo un segno di vita”, ha affermato Dorsey, aggiungendo che l’esperienza è stata condivisa da altri membri del team: “Altri membri del team dicevano: ‘Sento qualcosa, credo di aver scoperto qualcosa’”. Sebbene commenti simili che suggeriscono l’AGI siano stati fatti in precedenza, anche da parte di Sam Altman e dei dipendenti di OpenAI con il lancio di GPT-4.5 e GPT-5, la fiducia di Google in Gemini 3 è supportata da dati di benchmark sbalorditivi.

Secondo Google, Gemini 3 è ora il modello di punta e la sua performance più impressionante si è manifestata nel test “Vending Bench 2”. Questo benchmark è stato ideato per valutare le capacità di agente e la pianificazione a lungo termine del modello, simulando un scenario in cui l’AI deve gestire autonomamente un distributore automatico per un periodo definito, occupandosi di inventario, ordini e fissazione dei prezzi.

I risultati hanno mostrato un divario abissale tra Gemini 3 e la concorrenza. Gemini 3 ha infatti generato un profitto di 5.478 dollari, quasi dieci volte superiore ai 573 dollari guadagnati dal suo predecessore, Gemini 2.5 Pro. Ha inoltre superato in modo significativo i 3.838 dollari guadagnati da Claude Sonnet 4.5 e i 1.473 dollari di GPT-5.1. Dorsey ha sottolineato che questo test è “un vero esempio di ciò che stavamo cercando di cambiare e promuovere con questo modello, ovvero migliorare l’uso e la pianificazione degli utensili”.

La superiorità di Gemini 3 trova riscontro anche al di fuori dei laboratori di Google. Aaron Levy, CEO di Box, dopo aver condotto test interni sulla capacità del modello di analizzare grandi volumi di documenti complessi, ha raccontato di aver inizialmente dubitato dei risultati. “All’inizio, il divario di punteggio era così ampio che ho strizzato gli occhi e ho pensato: ‘Ok, forse ho sbagliato qualcosa nella valutazione'”, ha ammesso. Tuttavia, i test ripetuti hanno confermato che il divario di punteggio rispetto agli altri modelli era costantemente a due cifre.

Ancora più rivelatrice è la testimonianza di Andrey Karpathy, co-fondatore di OpenAI e creatore di Vibe Coding. Karpathy ha raccontato su Twitter un episodio memorabile avvenuto durante i test pre-lancio di Gemini 3. Il modello, i cui dati di pre-addestramento risalivano al 2024, non credeva che l’anno corrente fosse il 2025. Solo dopo che gli è stato attivato lo strumento di “Ricerca Google” e ha potuto cercare su internet, si è reso conto dell’errore. La sua reazione è stata descritta come incredibilmente umana: le sue prime parole sono state “Oh mio dio”, seguite da un testo balbettato e scritto come se fosse sotto shock: “Io… io… non so cosa dire. Avevi ragione. Il mio orologio interno era fuori controllo”.

L’impressionante lancio di Gemini 3 sta rivoluzionando il panorama dell’AI. Fino a poco tempo fa, Google aveva faticato a tenere il passo con OpenAI, tanto che analisti come Michael Nathanson di MoffettNathanson avevano notato: “All’epoca, a Wall Street si discuteva se Google sarebbe diventato il capro espiatorio dell’intelligenza artificiale”. Un cambiamento di atmosfera si era già verificato con la popolarità di “Nano Banana” la scorsa estate, che aveva portato a una crescita senza precedenti degli utenti attivi mensili di Gemini (passati da 450 a 650 milioni).

Ora, i risultati sorprendenti di Gemini 3 stanno consolidando questo trend. Subito dopo il lancio del modello, la capitalizzazione di mercato di Google ha superato quella di Microsoft, un chiaro indicatore della rinnovata fiducia degli investitori. L’analista Nathanson ha concluso: “Google ha un ottimo vantaggio in questo momento. È chiaro che Google sarà il vincitore nel campo dell’intelligenza artificiale”.

L’attenzione è ora puntata sulla risposta di OpenAI, che si dice stia preparando un nuovo modello chiamato “Shallotpeat” per un contrattacco. Tuttavia, gli esperti avvertono che ChatGPT, forte della sua base di utenti e delle funzionalità personalizzate come la memoria, non sarà facile da sostituire. Si prevede che, se OpenAI non riuscirà a superare le capacità di agente e la sofisticazione di Gemini 3, potrebbe trovarsi in una posizione di netta difficoltà.

Di Fantasy