Google DeepMind ha annunciato oggi il lancio di Gemma, i suoi nuovi modelli open source 2B e 7B, basati sulla stessa ricerca e tecnologia dei modelli Gemini recentemente introdotti dall’azienda. Secondo quanto riportato in un post sul blog, i modelli Gemma verranno rilasciati con varianti pre-addestrate e ottimizzate per le istruzioni. I pesi del modello saranno distribuiti con una licenza commerciale permissiva, insieme a un nuovo toolkit di intelligenza artificiale generativa responsabile.

Inoltre, Google fornirà una toolchain per l’inferenza e la messa a punto supervisionata (SFT) in tutti i principali framework, inclusi JAX, PyTorch e TensorFlow tramite Keras 3.0 nativo. Saranno disponibili notebook Colab e Kaggle preconfigurati e Gemma sarà integrato con Hugging Face, MaxText e NVIDIA NeMo. I modelli pre-addestrati e ottimizzati di Gemma con istruzioni possono essere eseguiti su laptop, workstation o Google Cloud, con distribuzione su Vertex AI e Google Kubernetes Engine.

In collaborazione con Google, Nvidia ha annunciato ottimizzazioni su tutte le piattaforme NVIDIA AI, incluso PC AI RTX, per migliorare le prestazioni di Gemma.

Google ora offre sia API che modelli aperti per il flusso di lavoro. Jeanine Banks, vicepresidente e direttore generale dello sviluppatore X e responsabile delle relazioni con gli sviluppatori di Google, ha dichiarato a VentureBeat in una conferenza stampa che i modelli Gemma rappresentano una continuazione della storia di Google nell’ambito della tecnologia open source per lo sviluppo di intelligenza artificiale, partendo da strumenti come TensorFlow e Jax fino ad arrivare ad altri modelli e sistemi come PaLM2 e AlphaFold, e ora Gemini.

Ha inoltre notato che, secondo il feedback ricevuto durante lo sviluppo dei modelli Gemini, Google DeepMind ha compreso che gli sviluppatori potrebbero utilizzare sia i modelli aperti che le API in modo complementare nel loro flusso di lavoro, a seconda della fase del progetto in cui si trovano.

Tris Warkentin, direttore della gestione del prodotto per Google DeepMind, ha aggiunto che l’azienda rilascerà una serie completa di benchmark per valutare Gemma rispetto ad altri modelli, che saranno disponibili pubblicamente nelle classifiche OpenLLM.

Ha sottolineato anche che Gemma è stata progettata con un focus sulla responsabilità e sulla sicurezza, con tutte le valutazioni necessarie per garantire che sia uno dei modelli più sicuri sul mercato nelle sue dimensioni.

Di Fantasy