Google DeepMind ha annunciato il rilascio di Gemma 2, una versione avanzata dei suoi modelli AI, disponibile in due versioni: una da 9 miliardi di parametri (9B) e una da 27 miliardi di parametri (27B). Questo nuovo modello è accessibile su diverse piattaforme, tra cui Google AI Studio, Kaggle, Hugging Face Models e presto su Vertex AI Model Garden. I ricercatori possono richiedere crediti Google Cloud per utilizzare Gemma 2 attraverso il programma di ricerca accademica, con scadenza per le domande fissata al 9 agosto.
Gemma 2 offre miglioramenti significativi rispetto al modello precedente, tra cui prestazioni competitive rispetto ai modelli proprietari più grandi e un’efficienza dei costi ottimizzata. Il modello da 27B può eseguire l’inferenza su una singola GPU NVIDIA H100 Tensor Core o in TPU, riducendo così i costi di distribuzione.
Il modello è compatibile con i principali framework AI come Hugging Face Transformers, JAX, PyTorch e TensorFlow tramite Keras 3.0. Gli sviluppatori possono distribuire Gemma 2 su varie configurazioni hardware, dai cloud alle CPU e GPU locali.
Gemma 2 è disponibile con una licenza favorevole all’innovazione e alla commercializzazione. I clienti di Google Cloud potranno distribuire e gestire Gemma 2 su Vertex AI a partire dal prossimo mese. Google offre anche il libro di cucina Gemma, che contiene esempi pratici per la costruzione e la messa a punto di applicazioni con Gemma 2.
Google sottolinea lo sviluppo responsabile dell’IA con Gemma 2, che include solidi processi di sicurezza, filtraggio dei dati pre-allenamento e test rigorosi per valutare bias e rischi. Tra gli strumenti di sicurezza ci sono il comparatore LLM e la tecnologia di watermarking del testo, SynthID.
L’uscita iniziale di Gemma ha superato i 10 milioni di download. Gemma 2 punta a supportare progetti ancora più ambiziosi, con piani futuri per il rilascio di un modello da 2.6 miliardi di parametri, bilanciando accessibilità e prestazioni.