L’antenna di Nvidia porta le GPU all’intelligenza artificiale su 5G
Ci è stato detto a tutti che l’intelligenza artificiale da sola, il 5G da solo e l’edge computing da solo avrebbero dovuto innescare cambiamenti monumentali nell’informatica. Di conseguenza, abbiamo creato aspettative su ciò che ciascuna di queste tecnologie avrebbe dovuto consentire da sola, ma francamente i risultati nel mondo reale sono stati deludenti.
Le persone stanno iniziando a capire che è necessario che tutti e tre lavorino insieme contemporaneamente per sentire il loro pieno impatto. È la combinazione della velocità e della bassa latenza del 5G, oltre alla portata estesa dell’edge computing e dell’intelligenza dell’intelligenza artificiale che può alimentare i tipi di applicazioni di grande impatto e scenari futuristici che ci erano stati originariamente promessi con il 5G.
A suo merito, Nvidia sembra aver riconosciuto questo punto qualche tempo fa. La società ha utilizzato il MWC di quest’anno per spiegare alcuni dei dettagli critici della sua strategia in queste aree, sfruttando gli sforzi precedentemente annunciati per l’Aerial A100. Nello specifico, l’azienda ha descritto la sua piattaforma di intelligenza artificiale sulla piattaforma 5G, evidenziando sia gli sviluppi software che la roadmap dei semiconduttori necessari per dare vita alle applicazioni di edge computing basate sull’intelligenza artificiale e fornite dal 5G, abilitando anche le funzionalità vRAN e Open RAN, il tutto all’interno di un singolo server.
C’è molto da disfare qui, quindi iniziamo con le basi. Nvidia offre da tempo software di intelligenza artificiale incentrato sull’azienda, accelerato da GPU, attraverso la sua piattaforma EGX e i suoi strumenti di sviluppo software basati su CUDA. Alcuni mesi fa, la società ha anche annunciato Aerial 5G, una piattaforma di sviluppo basata su software creata per consentire l’esecuzione accelerata di uno stack software Open RAN, funzioni di rete virtualizzate (VNF) e altri carichi di lavoro relativi alle telecomunicazioni su GPU Nvidia. -server attrezzati.
L’Aerial A100 è una scheda acceleratrice plug-in per server basati su x86 che incorpora una GPU di generazione Ampere e una DPU BlueField (versione 2.0). In combinazione con il software Aerial 5G, la combinazione consente di creare un’infrastruttura di rete 5G definita dal software sfruttando COTS o server commerciali standard di aziende come Dell, HPE, ecc. Poiché la scheda è identica ad altre quelli utilizzati per accelerare i server incentrati sulle applicazioni AI che eseguono la piattaforma EGX di Nvidia, lo stesso identico server potrebbe anche eseguire applicazioni AI basate su CUDA.
A quanto pare, le capacità di elaborazione parallela delle GPU che le rendono così adatte per l’esecuzione di applicazioni basate sull’intelligenza artificiale e sull’apprendimento automatico sono anche molto adatte per eseguire uno stack software 5G RAN completamente conforme a O-RAN 7.2 in grado di accelerazione Layer 1 completa . Infatti, in combinazione con la DPU BlueField-2, che è ottimizzata per spostare in modo efficiente blocchi di dati in carichi di lavoro in stile cloud-native, edge computing, la combinazione di scheda Aerial e software costituisce un’apparecchiatura per l’infrastruttura di rete veloce e potente. Questa combinazione supporta ciò che Nvidia chiama 5T per 5G (Time Triggered Transmission Technology for Telco), che è la capacità di supportare la versione di Ethernet sensibile al tempo SyncE, consentendo applicazioni di edge computing a bassa latenza.
A un livello più pratico, la capacità di gestire sia il software RAN che le applicazioni AI in un’unica scatola rende anche più semplice distribuire un server in più ambienti. Ciò, a sua volta, lo rende adatto per applicazioni di edge computing ampiamente disperse. Inoltre, per le aziende che potrebbero voler implementare reti 5G private, la combinazione di entrambe le funzionalità può potenzialmente ridurre i costi e il consumo energetico, nonché il sovraccarico di gestione della rete.
Naturalmente, il mondo dell’infrastruttura di rete definita da software e basata su O-RAN è relativamente nuovo, quindi c’è molto apprendimento e sperimentazione in corso. Di conseguenza, è stato interessante vedere che Nvidia ha anche annunciato una partnership con Google Cloud per creare un laboratorio congiunto focalizzato sulla creazione di applicazioni basate su AI-on-5G. Mentre il mondo delle telecomunicazioni inizia a migrare lontano dalle tradizionali scatole chiuse e infrastrutturali personalizzate che lo hanno alimentato negli ultimi decenni, ha abbracciato le moderne architetture software basate su container introdotte dai principali fornitori di cloud computing. Di conseguenza, non è affatto sorprendente vedere aziende come Google Cloud (così come AWS di Amazon e Azure di Microsoft) essere maggiormente coinvolte con aziende tecnologiche tradizionali come Nvidia per creare insieme nuove importanti offerte per il mercato delle infrastrutture di rete. In effetti, mi aspetto che questi tipi di partnership si espandano rapidamente e si allarghino in modo significativo nel tempo. Sono queste combinazioni di aziende che probabilmente guideranno la creazione di applicazioni avanzate che sfruttano contemporaneamente 5G, AI e edge computing.
L’ultima parte delle notizie di Nvidia AI-on-5G è incentrata sulla sua roadmap del silicio per il mercato delle telecomunicazioni. La prossima versione delle schede della serie Aerial dovrebbe includere sia un chip con architettura GPU di nuova generazione che una DPU BlueField-3. Insieme, Nvidia ha affermato che la combinazione dovrebbe offrire tre volte le prestazioni per watt sui carichi di lavoro basati su vRAN rispetto al modello odierno. Ancora più importante, tuttavia, BlueField-3 incorporerà sedici core CPU Arm basati su A78. Ciò significa che la scheda potrebbe funzionare da sola in un server, senza una CPU x86, in altre parole, consente la possibilità di un’infrastruttura di rete 5G basata su Arm. Nvidia ha chiarito che funzionerà anche come la scheda attuale come plug-in per server basati su CPU x86, ma l’opzione standalone è certamente uno sviluppo interessante, soprattutto alla luce del desiderio di Nvidia di acquistare Arm. Successivamente, l’azienda prevede di integrare sia la GPU che la DPU su un singolo chip con ulteriori miglioramenti delle prestazioni per watt.
In definitiva, ciò che Nvidia sta dimostrando rilasciando questi dettagli aggiuntivi sulle sue offerte Aerial 5G è che la sua combinazione di tecnologie di chip, così come i suoi strumenti software, la posizionano bene per essere un giocatore potenzialmente formidabile nel mondo dell’infrastruttura di rete 5G. È ancora relativamente presto per gli ambienti O-RAN basati su software, ma è chiaro che Nvidia sta facendo uno sforzo serio e convincente per estendere l’influenza dell’azienda anche oltre il punto in cui si trova oggi.