Google ha presentato Gemma, una serie di modelli di intelligenza artificiale (IA), a febbraio, rilasciando due versioni con 2 miliardi e 7 miliardi di parametri. Quest’anno, alla conferenza Google I/O, hanno introdotto Gemma 2, il primo membro di questa serie, che ha 27 miliardi di parametri ed è progettato per essere più grande ma leggero, ottimizzato per funzionare su GPU Nvidia di nuova generazione o su un singolo host TPU in Vertex AI. Questo lo rende più facile da usare e sta già superando modelli precedenti più grandi.
Gemma è stata ideata per gli sviluppatori che vogliono incorporare l’IA nelle loro app e dispositivi senza richiedere molta memoria o potenza di elaborazione, rendendola adatta a dispositivi come smartphone, IoT e PC. Gemma 2 promette risultati più accurati e prestazioni migliori rispetto ai suoi predecessori grazie ai suoi 27 miliardi di parametri, consentendo all’IA di fornire risposte di alta qualità più rapidamente.
È progettato per funzionare su TPUv5e, l’ultimo chip AI di Google, rendendo più efficiente l’utilizzo delle risorse e risparmiando tempo e denaro agli sviluppatori. Questo arriva poco dopo il lancio di GPT-4 di OpenAI, ma è considerato un aggiornamento significativo soprattutto per gli utenti di ChatGPT gratuito.