Nel settore dei chip per l’intelligenza artificiale, dominato da giganti come Nvidia, emerge una startup californiana che punta a rivoluzionare l’infrastruttura dell’AI: Positron. Fondata nel 2023, Positron ha sviluppato una linea di chip per l’inferenza dei modelli linguistici di grandi dimensioni (LLM) che promette prestazioni superiori a un costo energetico e finanziario notevolmente inferiore rispetto ai prodotti concorrenti.
Il cuore dell’offerta di Positron è il sistema Atlas, un acceleratore progettato per l’inferenza di modelli transformer. Secondo i dati forniti dall’azienda, Atlas è in grado di elaborare 280 token al secondo per utente utilizzando solo 2000 watt di potenza, mentre i sistemi Nvidia DGX H200 raggiungono i 180 token al secondo con un consumo di 5900 watt. Questo si traduce in un’efficienza energetica superiore di circa il 300%, con un miglioramento del rapporto prestazioni/costo di oltre tre volte.
Un aspetto distintivo della tecnologia di Positron è l’ottimizzazione dell’utilizzo della memoria. Mentre le architetture tradizionali spesso presentano un utilizzo della larghezza di banda della memoria compreso tra il 10% e il 30%, Atlas raggiunge il 93%, consentendo di gestire modelli fino a 500 miliardi di parametri in un singolo server da 2 kW.
A differenza di molti concorrenti, Positron ha scelto di produrre i suoi chip negli Stati Uniti. I primi modelli sono stati fabbricati utilizzando impianti Intel in Arizona, con l’assemblaggio finale effettuato internamente. Questa scelta non solo riduce la dipendenza da fornitori esteri, ma risponde anche a esigenze di sovranità tecnologica e sicurezza della supply chain, aspetti sempre più rilevanti per le aziende e le istituzioni governative.