Google annuncia una serie di aggiornamenti significativi nella sua linea di modelli di intelligenza artificiale Gemini, evidenziando il lancio di Gemini 2.0 Pro, Gemini 2.0 Flash-Lite e l’integrazione del modello di ragionamento Flash Thinking con servizi chiave come YouTube, Maps e Search.
La serie Gemini di modelli linguistici di grandi dimensioni (LLM) di Google ha visto una progressione costante sin dal suo debutto. Nonostante alcune difficoltà iniziali, l’azienda ha lavorato diligentemente per migliorare le capacità e l’affidabilità dei suoi modelli AI. Con il rilascio di Gemini 2.0, Google mira a offrire soluzioni AI più potenti e versatili sia per i consumatori che per le imprese.
Il modello Gemini 2.0 Flash, inizialmente lanciato in versione sperimentale nel dicembre 2024, è ora pronto per la produzione. Progettato per applicazioni AI ad alta efficienza, offre risposte a bassa latenza e supporta il ragionamento multimodale su larga scala. Una caratteristica distintiva è la sua finestra di contesto di 1 milione di token, che gli consente di gestire grandi quantità di informazioni, rendendolo particolarmente utile per compiti ad alta frequenza e su larga scala.
Gemini 2.0 Flash-Lite è un nuovo modello LLM progettato per fornire una soluzione AI economica senza compromettere la qualità. Secondo Google DeepMind, Flash-Lite supera il suo predecessore, Gemini 1.5 Flash, in benchmark di terze parti come MMLU Pro e Bird SQL programming, mantenendo la stessa struttura di prezzo e velocità. Supporta input multimodali e presenta una finestra di contesto di 1 milione di token, simile al modello Flash completo. Attualmente, Flash-Lite è disponibile in anteprima pubblica tramite Google AI Studio e Vertex AI, con la disponibilità generale prevista nelle prossime settimane.
Per gli utenti che richiedono capacità AI più avanzate, il modello Gemini 2.0 Pro (Sperimentale) è ora disponibile per i test. Google DeepMind lo descrive come il suo modello più forte per le prestazioni di codifica e la gestione di prompt complessi. Presenta una finestra di contesto di 2 milioni di token e capacità di ragionamento migliorate, con la possibilità di integrare strumenti esterni come Google Search ed esecuzione di codice.
Oltre a questi aggiornamenti, Google ha annunciato l’integrazione del suo modello di ragionamento, Flash Thinking, con servizi popolari come YouTube, Maps e Search. Questa integrazione consente una nuova gamma di ricerche e interazioni potenziate dall’AI, offrendo agli utenti informazioni più approfondite e pertinenti. Ad esempio, gli utenti possono ora ottenere panoramiche dettagliate su argomenti complessi, visualizzare mappe interattive con suggerimenti basati sull’AI e ricevere risultati di ricerca più contestualizzati.
Parallelamente a questi aggiornamenti, Google DeepMind sta implementando nuove misure di sicurezza per i modelli Gemini 2.0. L’azienda sta utilizzando tecniche di apprendimento per rinforzo per migliorare l’accuratezza delle risposte, utilizzando l’AI per criticare e affinare i propri output. Inoltre, vengono utilizzati test di sicurezza automatizzati per identificare vulnerabilità, inclusi potenziali attacchi di injection di prompt.
Guardando al futuro, Google DeepMind prevede di espandere le capacità della famiglia di modelli Gemini 2.0, con ulteriori modalità oltre al testo che dovrebbero diventare generalmente disponibili nei prossimi mesi.