Immagine AI

Rokid sta accelerando lo sviluppo della propria piattaforma di smart glasses AI puntando su esperienze agentiche sempre più autonome, contestuali e multimodali attraverso l’integrazione di Gemini 3.5 Flash nei propri dispositivi wearable. L’obiettivo dell’azienda è trasformare gli occhiali intelligenti da semplici interfacce vocali a sistemi AI persistenti capaci di comprendere il contesto ambientale, mantenere continuità conversazionale e orchestrare task complessi tramite interazione naturale.

L’evoluzione arriva in parallelo con la nuova strategia “agentic AI” presentata da Google durante il recente I/O, dove Gemini è stato progressivamente trasformato da assistente conversazionale a infrastruttura esecutiva distribuita tra cloud, dispositivi personali e wearable intelligenti. In questo scenario, Rokid sta posizionando i propri occhiali come endpoint fisici permanenti dell’ecosistema AI, sfruttando la bassa latenza di Gemini 3.5 Flash per gestire interazioni continue direttamente nel flusso della vita quotidiana.

Rokid sta lavorando su un’architettura device-to-cloud che consente agli smart glasses di distribuire il carico inferenziale tra elaborazione locale e modelli AI remoti. Questo approccio permette di combinare analisi visiva, input audio, traduzione in tempo reale e reasoning contestuale senza appesantire eccessivamente l’hardware wearable. La piattaforma supporta già più modelli linguistici integrati, inclusi Gemini, ChatGPT, DeepSeek e Qwen, consentendo agli utenti di passare dinamicamente da un modello all’altro in base al task richiesto.

Uno degli aspetti più rilevanti riguarda il concetto di AI “always available”. Gli smart glasses vengono progettati come un layer computazionale persistente capace di osservare continuamente l’ambiente circostante attraverso fotocamere, audio ambientale e input vocali, costruendo un contesto operativo dinamico per gli agenti AI. In pratica, il dispositivo non reagisce soltanto ai comandi espliciti dell’utente, ma punta a sviluppare capacità di assistenza continua basate sulla comprensione situazionale.

Rokid sta inoltre investendo molto nell’ecosistema sviluppatori. Attraverso la piattaforma Rizon, costruita sopra Coze Studio e adattata internamente, l’azienda vuole permettere alla community di creare agenti personalizzati, workflow vocali e automazioni multimodali senza dover sviluppare infrastrutture AI da zero. L’idea è costruire un marketplace di micro-agenti wearable in grado di gestire traduzione, navigazione, produttività personale, ricerca contestuale e automazioni quotidiane direttamente attraverso gli occhiali.

L’approccio scelto da Rokid si distingue anche per la strategia di ecosistema aperto. Mentre altri produttori tendono a legare hardware e modelli proprietari all’interno di stack chiusi, Rokid sta costruendo un ambiente interoperabile dove modelli occidentali e cinesi possono convivere sullo stesso dispositivo. Questa scelta consente di adattare le capacità AI ai diversi mercati geografici e alle esigenze linguistiche locali, elemento particolarmente importante per l’espansione internazionale del brand.

Sul piano hardware, l’azienda continua a spingere verso form factor sempre più leggeri e utilizzabili quotidianamente. I nuovi modelli AI Glasses Style integrano interazione vocale in 12 lingue, traduzione in tempo reale in 89 lingue e supporto multimodale in un telaio progettato per un utilizzo continuativo durante la giornata. L’obiettivo industriale è rendere gli smart glasses una piattaforma AI general purpose più naturale dello smartphone per determinate interazioni contestuali.

L’integrazione con Gemini 3.5 Flash rappresenta soprattutto un passaggio strategico verso la convergenza tra AI agentica, spatial computing e wearable computing. In questo modello, gli smart glasses non sono più semplici accessori AR, ma terminali intelligenti permanenti che funzionano come estensione cognitiva dell’utente, capaci di recuperare informazioni, comprendere l’ambiente, interagire con servizi cloud e coordinare azioni attraverso workflow AI distribuiti.

Di Fantasy