Immagine AI

Le limitazioni fisiche ed energetiche del silicio tradizionale stanno diventando il principale collo di bottiglia per la scalabilità dei Large Language Models. La risposta di Lumai a questa sfida si concretizza in Iris Nova, un server AI ottico progettato per superare le barriere di efficienza e throughput che affliggono le attuali architetture basate su GPU e acceleratori elettronici convenzionali.

Il cuore tecnologico di Iris Nova risiede nel superamento del modello di calcolo planare tipico dei chip in silicio. Mentre i processori tradizionali muovono elettroni attraverso circuiti bidimensionali soggetti a resistenze elettriche e generazione di calore, il sistema di Lumai sfrutta i fotoni per eseguire operazioni matematiche complesse. Questo approccio permette una parallelizzazione massiccia in uno spazio tridimensionale, dove milioni di segnali luminosi possono incrociarsi e processare dati simultaneamente senza le interferenze tipiche dei conduttori metallici. Il risultato immediato di questa architettura è una drastica riduzione del consumo energetico, stimata fino al novanta per cento in meno rispetto ai sistemi tradizionali, un dato che affronta direttamente la crisi energetica che sta colpendo i moderni data center.

Iris Nova adotta una struttura ibrida che garantisce la massima compatibilità con gli ecosistemi software esistenti. Sebbene il nucleo delle operazioni tensoriali venga gestito dal motore ottico, il sistema mantiene componenti digitali convenzionali per la gestione del flusso di controllo e del software. Questa scelta progettuale permette alle imprese e ai fornitori di servizi cloud di integrare la tecnologia ottica all’interno delle infrastrutture rack standard senza dover riscrivere interamente gli stack applicativi. L’efficacia di questo approccio è dimostrata dalla capacità del server di gestire modelli con miliardi di parametri, come Llama 8B e Llama 70B, garantendo tempi di risposta in tempo reale che sono fondamentali per le applicazioni generative di prossima generazione.

Un aspetto particolarmente rilevante dell’architettura Iris Nova riguarda l’ottimizzazione della fase di “prefill” durante l’inferenza. In questa fase, il modello deve elaborare rapidamente una grande quantità di dati in ingresso prima di iniziare a generare i token di risposta. Grazie alla natura intrinsecamente veloce della propagazione luminosa e alla capacità del calcolo ottico di gestire carichi di lavoro ad alta densità senza i ritardi causati dai cicli di clock elettronici, il server di Lumai accelera sensibilmente questo passaggio critico, migliorando la latenza complessiva percepita dall’utente finale.

L’introduzione di Iris Nova non rappresenta solo un miglioramento incrementale delle prestazioni, ma segna l’inizio di una nuova famiglia di prodotti che include anche le serie Aura e Tetra, destinate a diverse scale di implementazione. Spostando il parametro di riferimento dalla semplice potenza bruta al throughput per watt, Lumai risponde alle necessità concrete degli hyperscaler e dei centri di ricerca che si trovano a dover raddoppiare la capacità di calcolo a fronte di una disponibilità di potenza elettrica spesso statica o limitata dalle normative ambientali. Il calcolo ottico si propone quindi come il paradigma necessario per sostenere la crescita della tecnologia trasformativa dell’intelligenza artificiale, rendendo sostenibile l’integrazione di modelli sempre più complessi nella quotidianità produttiva e industriale.

Di Fantasy