Alibaba presenta il chip AI Zhenwu M890 e punta a competere con Nvidia nel training e nell’inferenza

Alibaba sta accelerando la propria strategia nel settore delle infrastrutture AI con la presentazione del nuovo acceleratore Zhenwu M890, un chip sviluppato dalla controllata T-Head e progettato per sostenere carichi di lavoro avanzati legati ai modelli generativi e agli agenti AI autonomi. L’annuncio segna un passaggio importante nell’evoluzione dell’ecosistema hardware di Alibaba Cloud, che punta a ridurre la dipendenza dalle GPU occidentali e a costruire una piattaforma proprietaria per il training e l’inferenza dei modelli di nuova generazione.

Secondo Alibaba, il nuovo M890 offre prestazioni circa tre volte superiori rispetto alla generazione precedente Zhenwu 810E e introduce modifiche strutturali pensate specificamente per gli scenari di “agentic AI”, cioè sistemi capaci di mantenere il contesto operativo per lunghi periodi, coordinare più modelli contemporaneamente e svolgere attività complesse senza intervento umano continuo. Questo tipo di workload richiede un equilibrio molto diverso rispetto ai tradizionali modelli inferenziali, perché aumenta drasticamente il traffico dati tra memoria, acceleratori e rete interna del cluster.

Uno degli aspetti tecnici più rilevanti riguarda infatti l’espansione della memoria GPU da 96 GB a 144 GB, una scelta che punta a sostenere finestre contestuali più ampie, pipeline multi-agente e modelli con quantità crescenti di parametri attivi simultaneamente. In ambienti AI distribuiti, la memoria disponibile è diventata uno dei principali colli di bottiglia, soprattutto quando più modelli devono condividere stato, memoria conversazionale e catene di reasoning persistenti in tempo reale. Alibaba sostiene di aver ottimizzato non soltanto la capacità di memoria, ma anche la banda di comunicazione e la latenza inter-chip, elementi essenziali nei cluster AI moderni.

A differenza delle precedenti generazioni della serie Zhenwu, concentrate soprattutto sull’inferenza, il nuovo M890 supporta anche il training dei modelli AI, ampliando significativamente il posizionamento competitivo del chip. Questo significa che Alibaba non sta più cercando soltanto di costruire acceleratori per eseguire modelli già addestrati, ma una piattaforma hardware completa capace di sostenere l’intero ciclo di vita dell’intelligenza artificiale, dall’addestramento iniziale fino all’esecuzione in produzione.

Contestualmente, Alibaba ha presentato anche il Panjiu AL128 Supernode Server, una piattaforma che integra 128 acceleratori AI all’interno di un singolo rack. L’obiettivo è creare nodi ad alta densità computazionale destinati ai grandi data center AI e ai workload hyperscale, seguendo una strategia molto simile a quella adottata dai principali operatori globali nel settore delle infrastrutture per modelli generativi. La combinazione tra acceleratori proprietari e architetture rack-scale consente ad Alibaba di controllare sia il livello hardware sia quello cloud, aumentando i margini potenziali sulla monetizzazione dei servizi AI.

L’azienda ha inoltre annunciato una roadmap di sviluppo estremamente aggressiva, con il lancio di nuove generazioni di chip previsto su base annuale. Alibaba punta a introdurre il modello V900 nel terzo trimestre del 2027, promettendo un ulteriore incremento prestazionale di tre volte rispetto all’M890, seguito dal J900 nel 2028. Il ritmo di aggiornamento dichiarato richiama direttamente il modello operativo di Nvidia, oggi dominante nel mercato globale degli acceleratori AI.

Questo annuncio arriva mentre Alibaba continua ad aumentare gli investimenti nelle infrastrutture di intelligenza artificiale nonostante la pressione sulla redditività emersa negli ultimi risultati finanziari. Il gruppo considera infatti il controllo della filiera hardware AI un elemento strategico fondamentale per la crescita futura del cloud e dei servizi generativi. Secondo i dati diffusi dall’azienda, sono già stati distribuiti circa 560.000 chip della serie Zhenwu e oltre 400 clienti appartenenti a venti settori differenti stanno utilizzando queste soluzioni, inclusi comparti come telecomunicazioni, automotive e finanza. Tra i clienti principali compare anche China Unicom, uno dei maggiori operatori telecom cinesi.

La strategia di Alibaba mostra chiaramente come la competizione nell’intelligenza artificiale si stia spostando sempre più dal livello dei modelli software verso il controllo diretto dell’infrastruttura computazionale. In questo contesto, il chip non rappresenta più soltanto un componente hardware, ma il punto centrale attraverso cui si definiscono capacità operative, costi di inferenza, scalabilità degli agenti AI e sostenibilità economica dell’intero ecosistema generativo.

Alibaba presenta il chip AI Zhenwu M890 e punta a competere con Nvidia nel training e nell’inferenza

DiFantasy

Di Fantasy

Articoli correlati

Google Managed Agents nella Gemini API per il runtime degli agenti dentro la piattaforma

OpenAI integra C2PA e SynthID di Google per rafforzare la verifica delle immagini generate dall’intelligenza artificiale

NanoClaw, second brain, trasforma gli AI agent open source in un’infrastruttura enterprise persistente e verificabile

Ultimi Post

Google Managed Agents nella Gemini API per il runtime degli agenti dentro la piattaforma

OpenAI integra C2PA e SynthID di Google per rafforzare la verifica delle immagini generate dall’intelligenza artificiale

NanoClaw, second brain, trasforma gli AI agent open source in un’infrastruttura enterprise persistente e verificabile

OpenAI afferma di aver trovato una soluzione ad un problema geometrico aperto dal 1946