Google Gemma 2

DiFantasy

Giu 28, 2024

Google DeepMind ha annunciato il rilascio di Gemma 2, una versione avanzata dei suoi modelli AI, disponibile in due versioni: una da 9 miliardi di parametri (9B) e una da 27 miliardi di parametri (27B). Questo nuovo modello è accessibile su diverse piattaforme, tra cui Google AI Studio, Kaggle, Hugging Face Models e presto su Vertex AI Model Garden. I ricercatori possono richiedere crediti Google Cloud per utilizzare Gemma 2 attraverso il programma di ricerca accademica, con scadenza per le domande fissata al 9 agosto.

Gemma 2 offre miglioramenti significativi rispetto al modello precedente, tra cui prestazioni competitive rispetto ai modelli proprietari più grandi e un’efficienza dei costi ottimizzata. Il modello da 27B può eseguire l’inferenza su una singola GPU NVIDIA H100 Tensor Core o in TPU, riducendo così i costi di distribuzione.

Il modello è compatibile con i principali framework AI come Hugging Face Transformers, JAX, PyTorch e TensorFlow tramite Keras 3.0. Gli sviluppatori possono distribuire Gemma 2 su varie configurazioni hardware, dai cloud alle CPU e GPU locali.

Gemma 2 è disponibile con una licenza favorevole all’innovazione e alla commercializzazione. I clienti di Google Cloud potranno distribuire e gestire Gemma 2 su Vertex AI a partire dal prossimo mese. Google offre anche il libro di cucina Gemma, che contiene esempi pratici per la costruzione e la messa a punto di applicazioni con Gemma 2.

Google sottolinea lo sviluppo responsabile dell’IA con Gemma 2, che include solidi processi di sicurezza, filtraggio dei dati pre-allenamento e test rigorosi per valutare bias e rischi. Tra gli strumenti di sicurezza ci sono il comparatore LLM e la tecnologia di watermarking del testo, SynthID.

L’uscita iniziale di Gemma ha superato i 10 milioni di download. Gemma 2 punta a supportare progetti ancora più ambiziosi, con piani futuri per il rilascio di un modello da 2.6 miliardi di parametri, bilanciando accessibilità e prestazioni.

Google Gemma 2

DiFantasy

Di Fantasy

Articoli correlati

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Ultimi Post

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Apple valuta aumenti di prezzo per iPhone mentre crescono i costi delle memorie per AI