Durante la conferenza annuale “re:Invent”, Amazon Web Services (AWS) ha presentato il Tm2 UltraServer, un innovativo server per data center equipaggiato con 64 chip di intelligenza artificiale proprietari, denominati Trainium2. Questa mossa strategica posiziona AWS in diretta competizione con NVIDIA nel settore dell’hardware AI.
Il Tm2 UltraServer è progettato per supportare l’addestramento e l’inferenza dei modelli di intelligenza artificiale di nuova generazione, offrendo una potenza di calcolo di 332 petaflop in operazioni FP8 per singolo workload. Rispetto ai precedenti server EC2 AI, questo nuovo modello fornisce una capacità computazionale cinque volte superiore e una memoria dieci volte più ampia.
Un aspetto distintivo del Tm2 UltraServer è la sua capacità di connettere un numero maggiore di chip rispetto alle soluzioni concorrenti, grazie a tecnologie proprietarie sviluppate da AWS. Secondo Gadi Hutt, responsabile dello sviluppo del business dei chip AI di AWS, l’utilizzo dei chip Trainium2 consente di ottenere prestazioni computazionali superiori e una riduzione dei costi, con un risparmio fino al 40% nei costi di addestramento di specifici modelli AI rispetto all’uso dei chip NVIDIA.
Importanti partner di AWS, come Anthropic e Apple, hanno già manifestato interesse per il Tm2 UltraServer. Matt Garman, CEO di AWS, ha annunciato la collaborazione con Anthropic nel progetto “Rainier”, volto alla costruzione di un EC2 UltraCluster che integrerà centinaia di migliaia di chip Trainium2, prevedendo un incremento di cinque volte nelle capacità computazionali per i modelli AI di Anthropic. Parallelamente, Benoit Dupin, dirigente di Apple, ha confermato l’intenzione di utilizzare i chip Trainium2 per l’addestramento dei modelli AI dell’azienda, con un’attesa di miglioramento dell’efficienza fino al 50%.
AWS prevede che il Tm2 UltraServer e l’UltraCluster saranno operativi nel corso del prossimo anno, pur non avendo specificato una data precisa. Mentre sia AWS che NVIDIA stanno accelerando il lancio dei loro prodotti per soddisfare la crescente domanda di soluzioni AI, AWS sembra beneficiare di una catena di fornitura più stabile, nonostante entrambe le aziende si affidino a TSMC per la produzione dei chip.
Inoltre, AWS ha annunciato l’intenzione di rilasciare il chip Trainium3 nel prossimo anno, progettato per ottimizzare l’addestramento e l’inferenza dei modelli di intelligenza artificiale generativa avanzata. Secondo Garman, questo nuovo chip sarà altamente specializzato per gestire workload complessi associati alle moderne applicazioni AI.
Con il lancio del Tm2 UltraServer e l’imminente arrivo del Trainium3, AWS rafforza la sua posizione nel mercato dell’hardware AI, offrendo soluzioni competitive e alternative efficaci alle proposte di NVIDIA.