Immagine AI

Grazie alla partnership tra Google Cloud e Cirrascale Cloud Services, il modello Gemini è ora disponibile in modalità air-gapped, ovvero installato su hardware fisico completamente scollegato dalla rete internet e dall’infrastruttura cloud di Google. Questa configurazione trasforma radicalmente il paradigma della sicurezza, permettendo a banche, agenzie governative e istituti di ricerca di operare con le capacità di Gemini Pro all’interno di una “bolla” privata, garantendo che né gli input degli utenti né le risposte generate escano mai dal perimetro fisico dell’organizzazione.

Il cuore tecnico di questa soluzione risiede in un’appliance hardware certificata da Google e prodotta da Dell, equipaggiata con otto GPU Nvidia e protetta da un involucro di confidential computing. A differenza delle tradizionali installazioni on-premises, dove il modello viene memorizzato su supporti persistenti, questa implementazione prevede che i pesi del modello Gemini risiedano esclusivamente nella memoria volatile del server. Questo design introduce una funzione di sicurezza fisica senza precedenti: nel momento in cui viene rimossa l’alimentazione o si verifica un tentativo di manomissione hardware che violi l’ambiente di calcolo riservato, il modello svanisce istantaneamente. L’appliance agisce come una sorta di “cassaforte a tempo”, rendendo impossibile l’estrazione o l’ispezione della proprietà intellettuale di Google o dei dati sensibili dei clienti anche in caso di accesso fisico non autorizzato.

Un aspetto fondamentale di questo approccio è la gestione delle sessioni utente. Il sistema opera tramite cache temporanee che vengono svuotate automaticamente al termine di ogni interazione, assicurando che non rimangano tracce residue di prompt o output sui dischi rigidi dell’appliance. Per le realtà che operano in ambiti di difesa o sanità, dove la connessione a un cloud pubblico è spesso vietata per legge, questa architettura risolve il dilemma tra l’utilizzo di modelli open-source meno capaci o la rinuncia alla privacy per accedere alle API dei grandi hyperscaler. Anche gli aggiornamenti del modello seguono protocolli rigorosi: le macchine possono essere connesse brevemente tramite canali privati e cifrati per caricare le nuove versioni, oppure, per i massimi livelli di sicurezza, Cirrascale prevede la sostituzione fisica del server con una nuova unità pre-caricata, garantendo la distruzione certificata di ogni dato presente sulla vecchia macchina.

L’impatto di questa tecnologia si estende oltre la semplice sicurezza, toccando la prevedibilità delle prestazioni e la flessibilità dei costi. Operando su hardware dedicato e non condiviso, le aziende eliminano le variazioni di latenza tipiche delle API pubbliche, un fattore critico per applicazioni mission-critical come il trading finanziario ad alta frequenza o la diagnostica medica in tempo reale. Inoltre, il software di orchestrazione a corredo dell’appliance consente agli amministratori di allocare dinamicamente le risorse, assegnando finestre di contesto (context windows) più ampie a utenti specifici, come programmatori o scienziati dei dati, e ottimizzando il carico di lavoro degli agenti AI durante le ore non di punta. Questa combinazione di isolamento fisico e controllo granulare delle risorse segna la fine del “compromesso impossibile”, portando l’intelligenza artificiale di classe superiore direttamente nei rack dei clienti, lontano dalla portata del cloud pubblico.

Di Fantasy