Google potenzia Gemini: miglioramenti significativi in matematica e ragionamento

Google ha recentemente introdotto una serie di modelli sperimentali della sua intelligenza artificiale, denominati “Gemini”, che hanno mostrato notevoli progressi in aree chiave come la matematica e il ragionamento. Questi sviluppi suggeriscono che l’azienda stia preparando il terreno per il lancio imminente di “Gemini 2.0”, previsto per il prossimo mese.

Google ha presentato “Gemini-exp-1121”, un modello sperimentale disponibile attraverso Google AI Studio e l’API di Gemini. Questo rilascio segue quello del 14 novembre, quando era stato introdotto “Gemini-exp-1114”. Sebbene Google non abbia esplicitamente dichiarato che questi modelli siano versioni di prova di Gemini 2.0, le tempistiche e le caratteristiche suggeriscono una connessione.

Uno degli aspetti più sorprendenti di “Gemini-exp-1121” è il miglioramento del 20% nelle prestazioni rispetto ai modelli precedenti, superando anche il noto “GPT-4o” di OpenAI. Questo incremento è particolarmente evidente in compiti di codifica, matematica e intelligenza artificiale visiva.

Dal punto di vista tecnico, “Gemini-exp-1121” incorpora diverse innovazioni:

Architettura Transformer ottimizzata: migliora l’efficienza e la capacità di apprendimento del modello.
Meccanismi di ricerca avanzati: consentono al modello di accedere e utilizzare dati in tempo reale, garantendo risposte aggiornate e precise.
Addestramento su dati di programmazione reali: l’uso di dati provenienti da vari linguaggi e framework ha affinato le capacità di codifica del modello.
Algoritmi di ragionamento potenziati: permettono al modello di affrontare e risolvere problemi matematici complessi con maggiore efficacia.
Architettura multimodale: abilita il modello a gestire simultaneamente input testuali e visivi, migliorando la comprensione e l’elaborazione di contenuti visivi.

Queste migliorie hanno portato a un aumento del 20% nella precisione delle risposte in benchmark standard. Inoltre, la capacità del modello di comprendere e analizzare contenuti visivi è stata notevolmente potenziata, rendendolo adatto a compiti come la narrazione visiva e la generazione di codice basata su schizzi di design.

Il 14 novembre, “Gemini-exp-1114” aveva già ottenuto riconoscimenti significativi, posizionandosi al primo posto nel sito di benchmark “Chatbot Arena”, superando modelli come “GPT-4o” e “o1-preview”. Questo modello aveva mostrato eccellenti performance in matematica, scrittura creativa e comprensione visiva.

Logan Kilpatrick, responsabile prodotto di Google AI Studio, ha suggerito su X (precedentemente Twitter) che un modello disponibile al pubblico generale sarà presto rilasciato, alimentando le aspettative per l’imminente lancio di Gemini 2.0.

Google potenzia Gemini: miglioramenti significativi in matematica e ragionamento

DiFantasy

Di Fantasy

Articoli correlati

xAI introduce la Quality Mode per Grok per la generazione di immagini e video con maggiore precisione strutturale

Netflix rilascia VOID, l’AI che rimuove oggetti dai video mantenendo la coerenza fisica della scena

Copilot e le clausole “solo per intrattenimento” nei servizi AI di Microsoft

Ultimi Post

xAI introduce la Quality Mode per Grok per la generazione di immagini e video con maggiore precisione strutturale

Netflix rilascia VOID, l’AI che rimuove oggetti dai video mantenendo la coerenza fisica della scena

Copilot e le clausole “solo per intrattenimento” nei servizi AI di Microsoft

Sistemi multi-agente: i modelli AI si proteggono tra loro