Intel lancia il guanto di sfida per le GPU AMD e Nvidia
La X e GPU dell’azienda per HPC sembra piuttosto buona, ma sarà abbastanza buona da raggiungere AMD e Nvidia?
Intel ha adottato una strategia “Domain-Specific Architecture” adottata da John L. Hennessy, presidente di Alphabet ed ex presidente della Stanford University. Di conseguenza, l’azienda ha almeno uno di tutto: CPU, GPU, vari ASIC e FPGA. Sebbene questa possa sembrare una strategia per gettare tutto contro il muro e vedere cosa si attacca, offre un certo fascino nel plasmare l’epitome dell’informatica eterogenea. Tuttavia, questo approccio è ad alta intensità di capitale, richiede molta ingegneria e pone un onere significativo sullo sviluppatore del software. Parliamo di una di queste architetture che è una novità assoluta per Intel: le GPU ad alte prestazioni.
Intel ha recentemente annunciato i dettagli sulla sua prossima GPU per data center, la X e HPC, nome in codice Ponte Vecchio (PVC). Intel ha audacemente insinuato che le prestazioni di picco della GPU PVC sarebbero circa il doppio di quelle della GPU più veloce di oggi, la Nvidia A100. PVC e Sapphire Rapids (lo Xeon multi-tile di nuova generazione) vengono utilizzati per costruire Aurora, il supercomputer Exascale dell’Argonne National Lab, nel 2022, quindi questa tecnologia dovrebbe finalmente essere dietro l’angolo.
Ponte Vecchio X e GPU HPC
Intel sta scommettendo su questa GPU per data center di prima generazione affinché HPC raggiunga finalmente Nvidia e AMD, sia per HPC (virgola mobile a 64 bit) che per intelligenza artificiale (interi a 8 e 16 bit e virgola mobile a 16 bit). Il dispositivo X e HPC è un pacchetto multi-tid e multi-processo con nuovi core GPU, memoria HBM2e, una nuova interconnessione Xe Link e PCIe Gen 5 implementato con oltre 100 miliardi di transistor. È quasi il doppio delle dimensioni del chip Nvidia A100 da 54 miliardi. A quelle dimensioni, il consumo di energia potrebbe essere un problema alle alte frequenze. Tuttavia, il design X e dimostra chiaramente che Intel ha capito; il confezionamento di stampi più piccoli aiuta a ridurre i costi di sviluppo e produzione e può migliorare il time to market.
Ponte Vecchio è un pacchetto di nodi multi-tile e multi-processo.
Ponte Vecchio dovrebbe iniziare la spedizione all’inizio del prossimo anno all’Argonne National Laboratory for Aurora, con decine di migliaia di GPU installate per fornire almeno 1,1 exaflop nel primo supercomputer HPC Exascale, finanziato dal DOE statunitense.
Ponte Vecchio promette un importante passo avanti nelle prestazioni di Intel HPC e AI.
Le prestazioni iniziali sono piuttosto impressionanti, raddoppiando all’incirca le prestazioni di Nvidia A100 con 45 trilioni di flop FP32 al secondo dal motore vettoriale e 1.468 INT8 TOPS dalle unità di elaborazione a matrice. Si dice che il chip mostruoso consumi circa 600 watt, il che lo rende davvero raro. La diapositiva di seguito è stata condivisa all’evento Intel Architecture Day ad agosto. Mentre la diapositiva manca di un asse X e riflette sicuramente le massime prestazioni, questo sembra rafforzare le affermazioni “due volte A100”.
Sarà interessante vedere come Intel posizionerà X e HPC rispetto a Habana Labs Gaudi. Una probabile biforcazione sarebbe quella di focalizzare Ponte Vecchio nel supercalcolo HPC e Gaudi come piattaforma di formazione scalabile per i fornitori di servizi cloud. Molto dipenderà dalla capacità di Intel di mettere in fila i team software per entrambi.
Software: OneAPI
Forse più importante di tutte le specifiche e i confronti competitivi, Intel dovrebbe essere in grado di sfruttare Aurora per iniziare a costruire la credibilità e la comunità attorno allo sviluppo per la GPU Ponte Veccio, incluso l’uso serio di oneAPI per AI e HPC. È stato detto molto sull’ambizioso obiettivo di Intel di fornire un’unica astrazione per il calcolo ad alte prestazioni e l’intelligenza artificiale, e l’azienda non ha rinunciato a questo nobile ma difficile obiettivo. Nei recenti briefing, la società ha ribadito le sue intenzioni e ha fornito alcune prove piuttosto convincenti che oneAPI sta ottenendo trazione sul mercato. Rimaniamo preoccupati che Habana non supporti ancora il software, ma mettendolo in prospettiva, non è e non dovrebbe essere la priorità a questo punto.
Sono molto impressionato da ciò che Intel ha realizzato sul fronte della GPU. Tuttavia, Ponte Vecchio sarà un’alternativa ad AMD e Nvidia solo se la piattaforma avrà un consumo energetico ragionevole e sarà completata da un software in grado di assicurare facilità d’uso e ottimizzazione. Quest’ultimo punto è critico; le prestazioni contano molto e Intel dovrà rendere semplice ed efficace l’ottimizzazione del codice e dei modelli per produrre il livello di prestazioni dichiarato.
Nella mia mente, non c’è dubbio che Ponte Vecchio abbia buone possibilità di diventare il simbolo del New Intel sotto la guida di Pat Gelsinger.