Google Cloud ha annunciato il rilascio di due nuove varianti del suo modello AI principale, Gemini 1.5 Flash e Pro, ora disponibili al pubblico. Gemini 1.5 Flash è un modello multimodale più piccolo con una finestra di contesto di 1 milione di token, progettato per compiti ad alta frequenza e stato presentato per la prima volta a maggio al Google I/O. Dall’altra parte, Gemini 1.5 Pro è la versione potenziata di Google LLM, introdotta a febbraio con una finestra di contesto ampliata a 2 milioni di token, ora accessibile a tutti gli sviluppatori.
Il lancio di queste varianti Gemini mira a dimostrare come il lavoro di Google AI possa facilitare lo sviluppo di agenti e soluzioni AI coinvolgenti. Durante una conferenza stampa, il CEO di Google Cloud, Thomas Kurian, ha sottolineato l’adozione crescente da parte di aziende come Accenture, Airbus, Anthropic, Box, Broadcom, Cognizant, Confluent, Databricks, Deloitte, Equifax, Estée Lauder Companies, Ford, GitLab, GM, Golden State Warriors, Goldman Sachs, Hugging Face, IHG Hotels and Resorts, Lufthansa Group, Moody’s, Samsung e altre, che sfruttano la piattaforma Vertex di Google insieme alle capacità dei modelli Google.
Google ha anche introdotto nuove funzionalità per migliorare l’esperienza degli sviluppatori, inclusi il caching del contesto e il throughput fornito. Il caching del contesto consente ai modelli di memorizzare e riutilizzare le informazioni già calcolate, riducendo i costi e migliorando l’efficienza, specialmente per conversazioni o documenti lunghi. Questa funzionalità è ora in anteprima pubblica sia per Gemini 1.5 Pro che per Flash, con potenziali risparmi fino al 75% sui costi di input.
Per quanto riguarda il throughput fornito, gli sviluppatori possono ora scalare meglio l’utilizzo dei modelli Gemini, determinando quanti query o testi un modello può elaborare nel tempo. Questo offre una maggiore prevedibilità e affidabilità nei carichi di lavoro di produzione, consentendo agli sviluppatori di riservare capacità di inferenza in base alle proprie esigenze.
Questi aggiornamenti rappresentano un passo significativo nel potenziamento delle capacità AI di Google, fornendo agli sviluppatori strumenti avanzati per creare soluzioni più robuste e performanti.