Nell’ecosistema in rapida e incessante evoluzione dell’Intelligenza Artificiale (IA) su vasta scala e del High-Performance Computing (HPC), la potenza di calcolo da sola non è più sufficiente. L’autentico collo di bottiglia che oggi determina il successo dei cluster più ambiziosi risiede nella rete di interconnessione, nel fabric che lega migliaia di processori e acceleratori (GPU) in un unico, coerente supercomputer. È in questo scenario di elevatissima posta in gioco che Cornelis Networks ha svelato la sua ultima innovazione di punta: la CN6000 800 Gbps Ethernet SuperNIC, una soluzione pensata per coloro che necessitano di prestazioni at scale senza dover sacrificare la flessibilità e l’interoperabilità degli standard aperti.
Il lancio del CN6000 segna, secondo gli esperti del settore, un vero e proprio punto di flessione, dove la compatibilità con l’Ethernet – lo standard onnipresente – incontra la necessità di prestazioni deterministiche tipiche dei fabric HPC costruiti su misura. Cornelis, forte della sua eredità nelle innovazioni Omni-Path, si propone di colmare le lacune di prestazioni, scalabilità e interoperabilità che hanno finora ostacolato gli operatori impegnati nella costruzione di fabric GPU su larga scala, offrendo un percorso verso la prossima generazione di infrastrutture di calcolo.
Il CN6000 SuperNIC è la prima soluzione della più ampia famiglia di prodotti di rete a 800 Gbps di Cornelis ed è stato appositamente costruito per fornire performance eccezionali, superando di due volte quelle della generazione precedente (il CN5000). Questo balzo in avanti si traduce nella capacità di sostenere una banda passante di 800 Gbps e di gestire un impressionante tasso di messaggi fino a 1,6 miliardi al secondo. Tali numeri non sono solo teorici; sono la spina dorsale della sua innovativa Multi-Modal Performance Pipeline.
Questa architettura unica fonde in un unico design latenza ultra-bassa, il più alto message rate del settore e il massimo throughput, risolvendo un compromesso che ha a lungo afflitto i progettisti di datacenter. Sbloccando la piena larghezza di banda e una latenza costantemente bassa anche su vasta scala, il CN6000 consente alle organizzazioni di accelerare drasticamente l’addestramento dei modelli di IA, massimizzando al contempo l’utilizzo dell’infrastruttura. Il risultato finale è un risparmio significativo sui costi operativi e sull’energia, oltre a un’accelerazione fondamentale nell’ottenimento dei risultati.
Uno dei problemi più persistenti e tecnici nell’architettura dei cluster GPU su vasta scala è rappresentato dalle difficoltà di scaling legate al protocollo RoCEv2 (RDMA over Converged Ethernet). Le architetture RoCEv2 tradizionali, infatti, tendono a collassare sotto il peso della gestione delle Queue Pairs (QP), ovvero le coppie di code di memoria necessarie per le comunicazioni all-to-all in un cluster. Questo sovraccarico di memoria porta inevitabilmente a bottleneck prestazionali e a comportamenti imprevedibili.
Il CN6000 supera brillantemente questa limitazione con un design fondamentalmente diverso. Sfruttando le Queue Pairs leggere (lightweight QPs) e una tabella RiF (RoCEv2 In-Flight) accelerata a livello hardware, il SuperNIC è in grado di tracciare milioni di operazioni RoCEv2 concorrenti con un footprint minimo. Questa soluzione garantisce una latenza prevedibile e la piena banda passante a qualsiasi scala, mantenendo la promessa di una scalabilità veramente illimitata senza i compromessi architettonici che hanno frenato le precedenti implementazioni di RoCEv2.
L’innovazione di Cornelis non è un’isola tecnologica; è pienamente allineata con i nuovi standard di settore. Il CN6000 è infatti completamente conforme agli standard Ultra Ethernet e RoCEv2, fornendo così un percorso standardizzato per l’adozione delle reti Ethernet di prossima generazione a 800 Gbps. Cornelis ha giocato un ruolo cruciale in questo processo, essendo lo sviluppatore originale e un contributore chiave di libfabric, l’interfaccia software di base ora adottata per le applicazioni Ultra Ethernet in ambito AI.
Questa aderenza agli standard è fondamentale per garantire un ecosistema diversificato e interoperabile, dando ai clienti la scelta e la flessibilità necessarie per soddisfare le esigenze di calcolo in evoluzione. Lo dimostrano le numerose e significative collaborazioni che circondano il lancio del CN6000: Cornelis sta lavorando con Intel per allineare il SuperNIC alla piattaforma Xeon, garantendo latenza bassa e scalabilità RDMA massiva. Partner del calibro di AMD, Lenovo (che vede in Ultra Ethernet un elemento trasformativo per il mercato AI), Altair e Synopsys hanno espresso sostegno, riconoscendo che soluzioni di interconnessione avanzate come il CN6000 sono essenziali per mantenere l’equilibrio tra calcolo e comunicazione in un’epoca dominata dai gemelli digitali (digital twins), dall’integrazione AI e dalla crescente complessità dei modelli di simulazione ingegneristica.
Il CN6000 è solo l’inizio. Cornelis ha in programma di offrire una nuova famiglia di switch Omni-Path serie CN6000 e piattaforme di classe director, consentendo una soluzione end-to-end Omni-Path pensata specificamente per l’HPC e l’AI. Con la promessa di un fabric a bassa latenza e a prova di congestione, il CN6000 promette di mantenere i carichi di lavoro in esecuzione in modo efficiente nell’era dei fabric a 800G, alzando l’asticella per l’intera industria del networking ad alte prestazioni.
