Nel panorama in rapida evoluzione dell’intelligenza artificiale (IA), Google ha compiuto un passo significativo con il rilascio di Gemma, una famiglia di modelli linguistici di grandi dimensioni (LLM) open source sviluppata da DeepMind. Questa iniziativa mira a democratizzare l’accesso a potenti strumenti di IA, promuovendo l’innovazione e l’applicazione responsabile in vari settori.
Gemma si basa su un’architettura transformer, una struttura che ha rivoluzionato l’elaborazione del linguaggio naturale (NLP). È disponibile in due dimensioni principali: un modello con 2 miliardi di parametri, ottimizzato per l’implementazione su dispositivi, e una versione più grande con 7 miliardi di parametri, progettata per l’uso su GPU e TPU. Entrambe le versioni sono state addestrate su un vasto corpus di dati, comprendente fino a 6 trilioni di token provenienti da testi web, matematica e codice, garantendo una comprensione approfondita e una generazione di linguaggio naturale di alta qualità.
Le capacità di Gemma sono state valutate attraverso oltre 25 benchmark, coprendo aree come risposta a domande, ragionamento, matematica, codifica, buon senso e dialogo. I risultati mostrano che Gemma raggiunge prestazioni all’avanguardia rispetto ad altri modelli open source di dimensioni simili. Ad esempio, nei test di ragionamento matematico come GSM8K e MATH, Gemma supera modelli come Codex e Claude di Anthropic di oltre 10 punti. In ambito di codifica, eguaglia o supera le prestazioni di Codex nei benchmark di programmazione come MBPP, nonostante non sia stato specificamente addestrato sul codice. Inoltre, nelle capacità di dialogo, Gemma dimostra una forte competenza conversazionale, con una percentuale di vittoria del 51,7% rispetto a Mistral-7B di Anthropic nei test sulle preferenze umane.
Il rilascio open source di modelli di grandi dimensioni comporta sfide legate all’uso improprio e ai bias intrinseci. DeepMind ha adottato misure per mitigare questi rischi, tra cui il filtraggio dei dati per rimuovere contenuti potenzialmente tossici o distorti, valutazioni su oltre 30 benchmark per testare sicurezza, equità e robustezza, e la messa a punto del modello per migliorare le capacità di sicurezza, come il filtraggio delle informazioni e comportamenti appropriati di rifiuto. Inoltre, sono state rilasciate schede modello dettagliate per promuovere la trasparenza sulle capacità, limitazioni e bias del modello.
L’open source di Gemma rappresenta un passo avanti nell’accessibilità dell’IA avanzata. Riduce le barriere per le organizzazioni che desiderano sviluppare applicazioni NLP all’avanguardia, consentendo una più ampia gamma di applicazioni in settori come l’istruzione, la scienza e l’accessibilità. Gli sviluppatori possono personalizzare ulteriormente Gemma per applicazioni specifiche attraverso la formazione continua su dati proprietari, promuovendo la ricerca e l’innovazione nel campo dell’IA.