Nel 2009, Intel si era affermata come leader nel campo dei supercomputer, grazie al fatto che i suoi chip alimentavano oltre l’80% dei 500 migliori supercomputer del mondo. Tuttavia, nel corso degli anni, AMD ha preso il sopravvento su Intel, ma sembra che ora Intel stia cercando di riscattarsi. Il nuovo supercomputer chiamato Aurora, basato sulla linea di chip Sapphire Rapids di Intel e progettato per soddisfare le esigenze di simulazione dell’Argonne National Laboratory, potrebbe presto surclassare AMD come il principale chip per il calcolo ad alte prestazioni.
Mentre queste due aziende rivali continuano a sfidarsi nel settore dei supercomputer, la competizione sta diventando sempre più intensa poiché altri giganti della tecnologia sembrano avere piani ambiziosi.
Google, Meta, Amazon e altri hanno iniziato a sviluppare i propri chip per ridurre la dipendenza dai produttori di chip e ottimizzare le loro infrastrutture. In un mercato estremamente competitivo, Intel ha l’opportunità di espandere la sua posizione e riconquistare il titolo di leader nel settore dei supercomputer.
Prima dell’annuncio di Aurora, il supercomputer Frontier di AMD, sviluppato per scopi di ricerca scientifica presso l’Oak Ridge National Laboratory, dominava incontrastato il mondo dei supercomputer. Sin dal suo lancio nel 2021, Frontier è stato l’unico supercomputer in grado di eseguire calcoli su scala exa. Un supercomputer exascale è in grado di eseguire oltre un quintilione di operazioni in virgola mobile al secondo (1 exaflop).
Secondo la classifica Top500, che elenca i migliori supercomputer del mondo, Frontier è attualmente l’unico supercomputer exascale in funzione. Tuttavia, sembra che Aurora sia pronto a cambiare questa situazione. L’annuncio di Aurora è stato fatto durante l’ISC High Performance Conference ed è stato progettato per contrastare la posizione di dominio di AMD nel campo dell’exascale. Le specifiche tecniche rilasciate indicano che Aurora non solo si propone di competere con Frontier, ma di superarlo.
Il percorso di Aurora verso l’exascale è stato caratterizzato da ritardi e revisioni, ma sembra che finalmente il supercomputer sia sulla buona strada. Il progetto è stato annunciato per la prima volta nel 2015, ma è stato ritardato due volte, nel 2017 e nel 2020. Questo non è sorprendente considerando che anche la linea di chip Sapphire Rapids di Intel, che alimenta Aurora, ha subito vari ritardi. Ora che i chip stanno finalmente arrivando sul mercato, Intel ha l’opportunità di mettersi in luce e conquistare una posizione di rilievo rispetto al suo principale concorrente.
Tuttavia, Intel si trova di fronte a un problema che non può essere trascurato: il consumo energetico. Frontier consuma 21 megawatt (MW) di potenza ed è stato per un certo periodo il supercomputer più efficiente al mondo. D’altro canto, Aurora dovrebbe consumare oltre 60 MW di potenza.
Il consumo energetico sta diventando una preoccupazione crescente per i vecchi data center e le strutture di calcolo. Secondo i rapporti, le CPU più recenti di Intel Xeon e AMD EPYC consumano fino a 350 watt ciascuna, mentre le GPU di NVIDIA richiedono ancora più energia.
A causa dell’aumento dei prezzi dell’energia in tutto il mondo e dell’attenzione crescente alla sostenibilità, le aziende sono alla ricerca di chip più efficienti e specializzati. Questi chip possono offrire una serie di vantaggi oltre al semplice risparmio energetico, rendendo l’idea di sviluppare i propri chip allettante per molte aziende.
Mentre supercomputer come Frontier e Aurora sono focalizzati sulla ricerca in campi come la fusione nucleare, le tecnologie a basse emissioni di carbonio, il cancro e le particelle subatomiche, le principali aziende tecnologiche stanno invece concentrando i loro sforzi sull’intelligenza artificiale.
Google, Meta, Amazon e persino Microsoft stanno cercando di emanciparsi da Intel, AMD e NVIDIA nel campo del calcolo per l’intelligenza artificiale. L’ultima versione del TPU di Google, chiamata TPUv4, specializzata nell’esecuzione di operazioni TensorFlow, è da 1,2x a 1,7x più veloce e da 1,3x a 1,9x più efficiente rispetto alle GPU A100 di NVIDIA. Amazon Web Services offre un’intera suite di chip specializzati per l’addestramento e l’inferenza nell’intelligenza artificiale, mentre Meta ha annunciato il Meta Training and Inference Accelerator (MTIA), un chip progettato per i carichi di lavoro di intelligenza artificiale interni all’azienda. Anche Microsoft sta lavorando su un chip specializzato per l’intelligenza artificiale, noto come Athena, sebbene i dettagli siano ancora scarsi.
È interessante notare che Intel sta cercando di competere anche in questo mercato, con Aurora che rappresenta una sorta di prova del concetto per dimostrare l’efficacia delle sue GPU e CPU. Sebbene la linea Sapphire Rapids non abbia ancora dimostrato tutto il suo potenziale e abbia avuto un’accoglienza discreta sul mercato, sembra che la serie di GPU per data center di Intel, chiamata Data Center GPU Max, potrebbe rappresentare una seria sfida per NVIDIA. Secondo Intel, la nuova linea di GPU supera in media del 30%-50% le GPU NVIDIA H100. Anche la CPU della serie Xeon Max di Intel supera i chip Genoa di AMD del 65%. Con la serie di acceleratori di deep learning Gaudi2, Intel sta cercando di ottenere una fetta più grande del mercato di NVIDIA, riducendo gradualmente la quota di mercato del suo concorrente.
Anche se AMD attualmente domina la classifica dei supercomputer, il nuovo set di chip di Intel punta sull’impatto di Aurora per riconquistare terreno nel settore aziendale. Nonostante le grandi aziende investano notevoli somme in ricerca e sviluppo per creare i propri chip, sembra probabile che Intel possa tornare a vincere nel settore del calcolo ad alte prestazioni (HPC).