Immagine AI

Nell’intelligenza artificiale mobile, due giganti tecnologici si contendono la leadership: Google con il suo modello open-source Gemma 3n e Apple con la sua iniziativa Apple Intelligence. Sebbene entrambe le soluzioni puntino a integrare l’AI direttamente nei dispositivi, le loro filosofie e implementazioni differiscono notevolmente. Mentre Apple si concentra su un approccio ibrido che combina l’elaborazione locale e basata su cloud, Google ha sviluppato Gemma 3n per funzionare interamente sui dispositivi, offrendo un’esperienza AI potente e privata.

Gemma 3n è il risultato della collaborazione tra Google DeepMind e leader del settore come Qualcomm, MediaTek e Samsung. Questo modello AI è progettato per funzionare su dispositivi mobili, tablet e laptop, supportando input multimodali tra cui testo, immagini e audio. Una delle innovazioni chiave di Gemma 3n è l’uso delle “Per-Layer Embeddings” (PLE), che riducono significativamente l’uso della memoria, consentendo al modello di operare con un’impronta di memoria dinamica compresa tra 2 e 3 GB. Ciò significa che anche dispositivi con risorse limitate possono eseguire compiti complessi come il riconoscimento vocale, la traduzione e l’elaborazione video in tempo reale, tutto senza necessità di una connessione a Internet.

D’altro canto, Apple Intelligence adotta un approccio più tradizionale, combinando l’elaborazione locale con quella basata su cloud. Mentre alcune operazioni vengono gestite direttamente sul dispositivo tramite i chip Apple Silicon, compiti più complessi richiedono l’accesso a server remoti. Questo modello, sebbene efficace in termini di privacy e integrazione con l’ecosistema Apple, può risultare meno reattivo e versatile rispetto a soluzioni completamente autonome come Gemma 3n.

Un confronto diretto tra i due modelli evidenzia le differenze nelle loro capacità. Secondo i benchmark, Gemma 3n ha ottenuto un punteggio di 1293 su LMArena, superando modelli come o3-mini di OpenAI, che ha ottenuto 1329 punti. Inoltre, Gemma 3n offre una finestra di contesto estesa fino a 128k token, permettendo una comprensione più profonda e una gestione più efficiente delle informazioni.

Un altro aspetto distintivo è l’approccio di Google all’accessibilità. Gemma 3n è open-source e disponibile tramite piattaforme come Google AI Studio, Kaggle e Hugging Face, consentendo agli sviluppatori di sperimentare e implementare facilmente il modello. Inoltre, l’introduzione dell’app Android “Edge Gallery” permette agli utenti di scaricare e utilizzare modelli AI direttamente sui loro dispositivi, promuovendo un’esperienza AI più integrata e personalizzata.

Di Fantasy