NVIDIA DGX Station Blackwell Ultra, il supercomputer da scrivania

Le workstation per l’intelligenza artificiale hanno raggiunto un nuovo traguardo con la presentazione della NVIDIA DGX Station basata sull’architettura Blackwell Ultra. Questo sistema non è semplicemente un aggiornamento hardware, ma una ridefinizione di ciò che è possibile fare localmente, portando la potenza di calcolo tipica dei grandi data center direttamente sulla scrivania di ricercatori e ingegneri.

Il cuore tecnologico di questa macchina è il superchip NVIDIA GB300 Grace Blackwell Ultra, un componente che fonde una CPU Grace da 72 core (basata su architettura Arm Neoverse V2) con una GPU Blackwell Ultra. La vera innovazione risiede nell’interconnessione NVLink-C2C, che stabilisce un ponte di comunicazione coerente da 900 GB/s. Questa velocità è circa sette volte superiore a quella del bus PCIe Gen 5 standard, eliminando di fatto il collo di bottiglia storico tra processore centrale e acceleratore grafico. Grazie a questa coerenza, il sistema può gestire una memoria unificata di 748 GB, permettendo di caricare e manipolare modelli linguistici (LLM) con un trilione di parametri (come GPT-4) senza dover dipendere dalla latenza o dai costi delle infrastrutture cloud.

La DGX Station eroga una performance di picco di 20 petaFLOPS in precisione FP4 (sparse), una metrica che fino a pochi anni fa avrebbe posizionato questa singola unità tra i supercomputer più potenti al mondo. L’introduzione del supporto nativo per il formato FP4 è fondamentale: riducendo la precisione numerica senza sacrificare significativamente l’accuratezza del modello, NVIDIA è riuscita a triplicare il throughput dell’inferenza e a ottimizzare l’utilizzo della memoria HBM3e (che vanta una larghezza di banda di 7.1 TB/s). Questo permette di eseguire cicli di iterazione rapidissimi, dove lo sviluppatore può testare kernel CUDA complessi o affinare modelli massivi come Qwen3-235B localmente, accorciando drasticamente il loop di feedback durante la fase di R&D.

Nonostante la sua natura indipendente, la DGX Station è progettata per essere inserita in flussi di lavoro complessi. È dotata di una scheda di rete NVIDIA ConnectX-8 SuperNIC che supporta velocità fino a 800 Gb/s, rendendo possibile il clustering di più unità attraverso reti Spectrum-X o Quantum InfiniBand. Questo significa che, sebbene la singola macchina possa gestire l’inferenza di un modello da un trilione di parametri, un gruppo di DGX Station può essere utilizzato per l’addestramento distribuito di modelli di frontiera o per la gestione di fabbriche di agenti IA (Agentic AI) sempre attive. La gestione del calore è affidata a un sistema di raffreddamento avanzato che mantiene i 1.600 W di consumo energetico entro limiti acustici e termici compatibili con un ufficio, garantendo al contempo che i componenti operino costantemente alla frequenza massima di clock.

In un mercato dove la sovranità dei dati e la protezione della proprietà intellettuale sono diventate prioritarie, la DGX Station Blackwell Ultra si posiziona come lo strumento definitivo per le aziende che vogliono mantenere il controllo totale sui propri modelli proprietari. La possibilità di eseguire l’intero ciclo di vita di un’intelligenza artificiale — dal prototipo al fine-tuning, fino all’inferenza su scala reale — senza mai inviare un singolo pacchetto di dati al di fuori della rete locale, rappresenta un vantaggio competitivo e

NVIDIA DGX Station Blackwell Ultra, il supercomputer da scrivania

DiFantasy

Di Fantasy

Articoli correlati

Nvidia presenta Vera Rubin, la piattaforma AI a sette chip progettata per la prossima generazione di modelli di OpenAI e Anthropic

NVIDIA BlueField-4 STX: come NVIDIA ha eliminato i rallentamenti dei dati con la nuova memoria per lo storage

L’unificazione dei sistemi di recupero del feed di LinkedIn tramite un singolo modello linguistico di grandi dimensioni

Ultimi Post

Nvidia presenta Vera Rubin, la piattaforma AI a sette chip progettata per la prossima generazione di modelli di OpenAI e Anthropic

NVIDIA BlueField-4 STX: come NVIDIA ha eliminato i rallentamenti dei dati con la nuova memoria per lo storage

L’unificazione dei sistemi di recupero del feed di LinkedIn tramite un singolo modello linguistico di grandi dimensioni

Z.ai lancia GLM-5 Turbo, un modello AI più veloce ed economico progettato per agenti software