Google ha recentemente presentato due nuove versioni dei suoi modelli di intelligenza artificiale, Gemini 1.5 Pro e Gemini 1.5 Flash, con l’obiettivo di offrire soluzioni più accessibili ed efficienti per sviluppatori e aziende. Questi aggiornamenti rappresentano un significativo passo avanti in termini di prestazioni e costi, con una riduzione fino al 52% nel prezzo dei token di output e un incremento sostanziale nei limiti di velocità e nella latenza del modello.
Il modello Gemini 1.5 Pro offre ora una capacità di elaborazione con limiti di velocità triplicati rispetto alla versione precedente, mantenendo una finestra di contesto lunga fino a 2 milioni di token. Questo consente una migliore gestione di compiti complessi come la comprensione video e l’elaborazione di documenti su larga scala. Inoltre, il costo dei token di input e output è stato ridotto rispettivamente del 64% e del 52%, rendendo questo modello più accessibile per applicazioni di larga scala.
Per il modello Gemini 1.5 Flash, Google ha raddoppiato i limiti di velocità e migliorato la latenza, ottimizzandolo per attività che richiedono risposte rapide e precise. Il modello è particolarmente indicato per applicazioni in tempo reale, dove la velocità di risposta è fondamentale.
I nuovi modelli di Gemini mostrano miglioramenti significativi nei benchmark. Nelle attività matematiche, ad esempio, è stato registrato un aumento del 20% nelle prestazioni, mentre nella generazione di codice Python e nella comprensione visiva si osserva un incremento fino al 7%. Questo si traduce in uno stile di risposta più conciso ed efficace, particolarmente utile nelle attività di riepilogo e risposta a domande complesse.
Google ha introdotto anche nuove impostazioni di filtro predefinite, che consentono agli sviluppatori di configurare le funzionalità di sicurezza in modo più flessibile. Questi filtri passano da una modalità di opt-in a una di opt-out, offrendo un maggiore controllo sulla gestione dei contenuti generati dall’IA.
Gli sviluppatori possono accedere gratuitamente ai nuovi modelli attraverso Google AI Studio o tramite la Gemini API. Le organizzazioni più grandi, invece, possono usufruire di questi aggiornamenti tramite Vertex AI. Le nuove funzionalità saranno disponibili a partire dal 1° ottobre 2024.
Nel prossimo futuro, Google prevede il lancio di Gemini 2, un modello che promette ulteriori innovazioni. In parallelo, la piattaforma sarà arricchita con nuove funzionalità come Veo, Google Search Grounding e Agents. Secondo Logan Kilpatrick, product manager di Google, i prossimi sei mesi saranno cruciali per sbloccare nuovi sviluppi e migliorare ulteriormente le capacità dell’IA generativa.