Google ha annunciato la nuova famiglia di modelli di intelligenza artificiale Gemma 4 introducendo un cambiamento che, secondo gli osservatori del settore, potrebbe avere un impatto più significativo delle stesse prestazioni tecniche: il passaggio alla licenza Apache 2.0. Questo aggiornamento segna un’evoluzione importante nella strategia di Google per i modelli open-weight, spostando l’attenzione dalla sola competizione sui benchmark a un tema più strutturale, quello della libertà d’uso e dell’integrazione commerciale.
Le precedenti versioni della famiglia Gemma erano distribuite con una licenza proprietaria personalizzata che introduceva alcune restrizioni e richiedeva interpretazioni legali prima dell’adozione in ambito aziendale. Questo scenario creava attriti per molte organizzazioni, che spesso preferivano modelli concorrenti con licenze più permissive. Con Gemma 4, Google elimina queste complessità adottando Apache 2.0, uno standard ampiamente utilizzato nell’ecosistema open source, senza clausole aggiuntive e senza limitazioni alla redistribuzione o all’uso commerciale.
La licenza Apache 2.0 è considerata particolarmente permissiva perché consente di utilizzare, modificare e distribuire il software, anche per scopi commerciali, senza obbligo di mantenere la stessa licenza nelle versioni derivate. Questo approccio riduce le barriere all’adozione e semplifica l’integrazione nei prodotti aziendali, rendendo i modelli più appetibili per startup e sviluppatori che necessitano di controllo completo sulle proprie implementazioni.
Gemma 4 si presenta come una famiglia articolata di modelli progettati per coprire diversi scenari di utilizzo. Google ha rilasciato quattro varianti organizzate in due categorie principali: modelli di fascia workstation e modelli destinati all’esecuzione su dispositivi edge. I modelli più grandi includono una versione densa da circa 31 miliardi di parametri e una variante Mixture-of-Experts da circa 26 miliardi, mentre le versioni più compatte sono pensate per funzionare su laptop, smartphone o sistemi embedded con requisiti hardware ridotti.
Un elemento tecnico interessante riguarda proprio l’architettura Mixture-of-Experts adottata per uno dei modelli principali. In questa configurazione solo una parte dei parametri viene attivata durante l’inferenza, permettendo di ottenere prestazioni paragonabili a modelli molto più grandi ma con costi computazionali inferiori. Questo approccio consente una maggiore efficienza e facilita l’esecuzione su hardware meno potente, ampliando i casi d’uso pratici.
La nuova famiglia Gemma 4 è stata inoltre progettata per essere multimodale, con supporto a input testuali e visivi per i modelli più grandi e capacità estese anche a audio e altri dati nelle varianti edge. I modelli workstation offrono finestre di contesto fino a centinaia di migliaia di token, mentre le versioni compatte mantengono un equilibrio tra dimensioni ridotte e funzionalità avanzate, favorendo l’esecuzione locale senza dipendenza dal cloud.
L’aspetto strategico più rilevante è tuttavia il posizionamento competitivo. Con la scelta di Apache 2.0, Google si allinea alle pratiche di altri attori dell’ecosistema open-weight, come Mistral e alcuni modelli Qwen, che hanno già adottato licenze permissive. Questo movimento riduce il vantaggio competitivo dei concorrenti e rende Gemma una base più attraente per lo sviluppo di applicazioni AI personalizzate.
La disponibilità di modelli open-weight con licenza permissiva consente alle aziende di eseguire l’inferenza localmente, modificare l’architettura, addestrare versioni personalizzate e distribuire prodotti senza vincoli contrattuali complessi. Questo è particolarmente rilevante per applicazioni che richiedono controllo sui dati, come sistemi enterprise, strumenti on-device o soluzioni offline.
Il rilascio di Gemma 4 si inserisce quindi in una strategia più ampia. Google continua a sviluppare modelli proprietari di fascia alta, come quelli della serie Gemini, ma parallelamente rafforza l’offerta open-weight per attirare sviluppatori e creare un ecosistema più ampio attorno alle proprie tecnologie. La disponibilità di modelli open e permissivi può funzionare come punto di ingresso per l’adozione di strumenti e infrastrutture Google, favorendo una strategia di espansione progressiva.
