Immagine AI

Huawei ha presentato un nuovo acceleratore per l’intelligenza artificiale destinato a rafforzare la propria posizione nel mercato dei chip per l’inferenza, entrando in competizione diretta con le soluzioni di Nvidia disponibili in Cina. Il dispositivo, denominato Atlas 350, è stato annunciato durante la China Partner Conference e rappresenta un’evoluzione dell’infrastruttura hardware dell’azienda, progettata specificamente per carichi di lavoro di inferenza su larga scala. Il lancio assume particolare rilevanza nel contesto delle restrizioni tecnologiche internazionali, che hanno spinto Huawei a sviluppare una filiera di semiconduttori più autonoma, basata sulla famiglia di chip Ascend.

Il cuore dell’Atlas 350 è il nuovo processore AI proprietario Ascend 950PR, progettato per ottimizzare l’esecuzione dei modelli di intelligenza artificiale durante la fase di inferenza. A differenza dell’addestramento, che richiede elevata precisione e grandi quantità di memoria, l’inferenza privilegia efficienza computazionale e throughput. In questo contesto, Huawei ha scelto di puntare su una configurazione ad alte prestazioni con supporto FP4, una modalità di calcolo a bassa precisione che consente di aumentare significativamente il numero di operazioni eseguibili per unità di tempo. L’Atlas 350 raggiunge prestazioni dichiarate pari a 1,56 petaflops in FP4, un valore che evidenzia l’orientamento del prodotto verso scenari di inferenza ad alta densità.

L’utilizzo del formato FP4 rappresenta una tendenza crescente nel settore dei chip AI. Riducendo la precisione numerica rispetto ai formati tradizionali come FP16 o FP32, è possibile aumentare il parallelismo e ridurre il consumo energetico, mantenendo un livello di accuratezza sufficiente per molti modelli di inferenza. Questo approccio è particolarmente efficace per LLM, sistemi di raccomandazione e modelli multimodali, dove il throughput è spesso più critico della precisione assoluta. Huawei ha quindi progettato l’Atlas 350 per gestire questi carichi di lavoro, includendo ottimizzazioni specifiche per la generazione di contenuti, l’elaborazione di query di ricerca e l’inferenza di modelli linguistici di grandi dimensioni.

Huawei ha dichiarato che l’Atlas 350 offre prestazioni superiori rispetto al chip Nvidia H2O, una GPU progettata specificamente per il mercato cinese in risposta alle restrizioni sull’esportazione dei modelli più avanzati. Secondo i dati forniti, l’acceleratore Huawei raggiungerebbe prestazioni fino a 2,8 volte superiori in alcuni scenari. Questo confronto evidenzia la crescente competizione nel segmento dell’inferenza AI, dove l’efficienza e il rapporto prestazioni-consumo stanno diventando fattori decisivi per l’adozione su larga scala.

Oltre all’Atlas 350, Huawei sta ampliando la propria offerta di soluzioni per l’implementazione dell’intelligenza artificiale in diversi contesti aziendali. Tra queste, è previsto il lancio del sistema FusionCube A1000, progettato per facilitare l’adozione dell’AI da parte delle piccole e medie imprese. Questo dispositivo mira a fornire un’infrastruttura integrata che combina calcolo, storage e software, semplificando la distribuzione di applicazioni AI senza la necessità di ambienti cloud complessi.

Di Fantasy