Google ha recentemente introdotto una serie di modelli sperimentali della sua intelligenza artificiale, denominati “Gemini”, che hanno mostrato notevoli progressi in aree chiave come la matematica e il ragionamento. Questi sviluppi suggeriscono che l’azienda stia preparando il terreno per il lancio imminente di “Gemini 2.0”, previsto per il prossimo mese.
Google ha presentato “Gemini-exp-1121”, un modello sperimentale disponibile attraverso Google AI Studio e l’API di Gemini. Questo rilascio segue quello del 14 novembre, quando era stato introdotto “Gemini-exp-1114”. Sebbene Google non abbia esplicitamente dichiarato che questi modelli siano versioni di prova di Gemini 2.0, le tempistiche e le caratteristiche suggeriscono una connessione.
Uno degli aspetti più sorprendenti di “Gemini-exp-1121” è il miglioramento del 20% nelle prestazioni rispetto ai modelli precedenti, superando anche il noto “GPT-4o” di OpenAI. Questo incremento è particolarmente evidente in compiti di codifica, matematica e intelligenza artificiale visiva.
Dal punto di vista tecnico, “Gemini-exp-1121” incorpora diverse innovazioni:
- Architettura Transformer ottimizzata: migliora l’efficienza e la capacità di apprendimento del modello.
- Meccanismi di ricerca avanzati: consentono al modello di accedere e utilizzare dati in tempo reale, garantendo risposte aggiornate e precise.
- Addestramento su dati di programmazione reali: l’uso di dati provenienti da vari linguaggi e framework ha affinato le capacità di codifica del modello.
- Algoritmi di ragionamento potenziati: permettono al modello di affrontare e risolvere problemi matematici complessi con maggiore efficacia.
- Architettura multimodale: abilita il modello a gestire simultaneamente input testuali e visivi, migliorando la comprensione e l’elaborazione di contenuti visivi.
Queste migliorie hanno portato a un aumento del 20% nella precisione delle risposte in benchmark standard. Inoltre, la capacità del modello di comprendere e analizzare contenuti visivi è stata notevolmente potenziata, rendendolo adatto a compiti come la narrazione visiva e la generazione di codice basata su schizzi di design.
Il 14 novembre, “Gemini-exp-1114” aveva già ottenuto riconoscimenti significativi, posizionandosi al primo posto nel sito di benchmark “Chatbot Arena”, superando modelli come “GPT-4o” e “o1-preview”. Questo modello aveva mostrato eccellenti performance in matematica, scrittura creativa e comprensione visiva.
Logan Kilpatrick, responsabile prodotto di Google AI Studio, ha suggerito su X (precedentemente Twitter) che un modello disponibile al pubblico generale sarà presto rilasciato, alimentando le aspettative per l’imminente lancio di Gemini 2.0.