Durante l’evento AWS re:Invent a Las Vegas, Amazon Web Services (AWS) ha rivelato due nuovi chip AI: AWS Graviton4 e AWS Trainium2. Questi nuovi chip mirano a portare miglioramenti significativi in termini di rapporto prezzo-prestazioni ed efficienza energetica per una vasta gamma di carichi di lavoro dei clienti, compresi quelli legati alla formazione nell’apprendimento automatico e alle applicazioni di intelligenza artificiale generativa.
AWS Graviton4 offre prestazioni di elaborazione superiori fino al 30%, con il 50% in più di core e il 75% in più di larghezza di banda di memoria rispetto al suo predecessore, Graviton3. Dall’altro lato, AWS Trainium2 offre un addestramento fino a 4 volte più veloce rispetto alla sua generazione precedente e può essere implementato in EC2 UltraClusters fino a 100.000 chip.
David Brown, VP di Compute and Networking presso AWS, ha enfatizzato che Graviton4 rappresenta già la quarta generazione di chip, sviluppata in soli cinque anni, ed è attualmente il chip più potente ed efficiente dal punto di vista energetico mai creato. Ha sottolineato che il silicio è un elemento cruciale per qualsiasi carico di lavoro dei clienti e rappresenta un’area fondamentale per l’innovazione da parte di AWS.
Brown ha anche evidenziato che AWS conta già su oltre 50.000 clienti che utilizzano i chip Graviton, mentre molti altri fornitori di servizi cloud stanno ancora pianificando o devono ancora fornire i loro primi processori per server. A tal proposito, Microsoft ha recentemente lanciato il suo primo sistema AI personalizzato interno su chip, denominato Azure Maia 100 AI Accelerator, durante l’evento Ignite 2023.
Alcuni dei clienti che hanno adottato i chip AWS includono importanti aziende come Anthropic, Databricks, Datadog, Epic, Honeycomb, SAP e molti altri. Ad esempio, Naveen Rao, vicepresidente dell’intelligenza artificiale generativa presso Databricks, ha dichiarato che AWS Trainium ha fornito loro la scalabilità e le elevate prestazioni necessarie per addestrare i loro modelli Mosaic MPT, il tutto a un costo contenuto.
Inoltre, Roman Visintine, lead cloud engineer di Epic Games, ha elogiato le istanze AWS Graviton4 come le istanze EC2 più veloci mai testate, offrendo prestazioni eccezionali anche nei carichi di lavoro più competitivi e sensibili alla latenza. Juergen Mueller, CTO di SAP SE, ha concluso affermando che durante il processo di migrazione di SAP HANA Cloud alle istanze Amazon EC2 basate su AWS Graviton, hanno già notato un miglioramento fino al 35% nel rapporto prezzo/prestazioni per i carichi di lavoro analitici.