Con la presentazione di ERNIE 5.0, avvenuta il 22 gennaio, Baidu ha segnato un passaggio simbolico e tecnico molto rilevante nella corsa globale all’intelligenza artificiale avanzata. Il nuovo modello, che raggiunge la soglia impressionante di 2,4 trilioni di parametri, diventa il più grande mai sviluppato in Cina e rappresenta un chiaro segnale della volontà di Baidu di competere direttamente con i grandi player statunitensi sul terreno dei modelli di base di nuova generazione.
La scala, da sola, racconta già molto. Fino a oggi i modelli cinesi più grandi si attestavano intorno al trilione di parametri, come Kimi K2 di Moonshot AI o Ling-1T di Ant Group. Con ERNIE 5.0 Baidu più che raddoppia questa soglia, collocandosi in una fascia che, fino a poco tempo fa, sembrava appannaggio esclusivo dei laboratori occidentali. Tuttavia, la dimensione non è l’unico elemento su cui l’azienda ha puntato per caratterizzare questo nuovo modello.
ERNIE 5.0 viene definito da Baidu come un modello “omnimodale nativo”. A differenza di molti sistemi multimodali esistenti, che combinano testo, immagini, audio e video in fasi successive, questo modello è stato progettato con un’architettura unificata autoregressiva che addestra congiuntamente tutte le modalità all’interno di un unico framework. Secondo Wu Tian, vicepresidente di Baidu, questa scelta consente una comprensione e una generazione realmente native delle diverse modalità, evitando le limitazioni tipiche dei sistemi che “incollano” le informazioni multimodali solo a valle del processo di addestramento.
Un altro aspetto cruciale riguarda l’efficienza. Gestire 2,4 trilioni di parametri non è soltanto una sfida concettuale, ma soprattutto computazionale. Baidu ha affrontato questo nodo adottando una combinazione molto estesa di Mixture of Experts (MoE) e attivazione sparsa. In pratica, durante l’inferenza vengono attivati soltanto circa 70 miliardi di parametri, meno del 3% del totale. Questo approccio consente di contenere i costi di calcolo e la latenza, riducendo al minimo il degrado delle prestazioni, e dimostra come l’attenzione non sia rivolta solo alla potenza bruta, ma anche alla sostenibilità operativa del modello nei servizi reali.
Dal punto di vista dell’accesso, Baidu ha scelto una strategia chiusa. ERNIE 5.0 non è stato rilasciato come open source e non è stato accompagnato da un rapporto tecnico pubblico. Gli utenti individuali possono utilizzarlo tramite Erniebot, mentre aziende e sviluppatori devono passare attraverso l’API disponibile sulla piattaforma di intelligenza artificiale Qianfan. Questa decisione viene letta da molti analisti come una mossa strategica: mantenere il controllo tecnologico per colmare più rapidamente il gap con i concorrenti internazionali e, allo stesso tempo, massimizzare il valore commerciale del modello nel mercato enterprise.
Sul fronte delle prestazioni, i benchmark pubblicati mostrano risultati solidi ma non clamorosi. ERNIE 5.0 si colloca su livelli comparabili a modelli di punta come Gemini 3 Pro, GPT-5 Hi e DeepSeek-V3.2 Thinking. In alcune valutazioni, Gemini 3 Pro continua a distinguersi, mantenendo un vantaggio complessivo. Nella classifica testuale di LM Arena pubblicata il 15 gennaio, la versione ufficiale Ernie-5.0-0110 ha raggiunto l’ottavo posto a livello mondiale e il primo tra i modelli cinesi, un risultato che Baidu ha sottolineato come indicativo della rapidità con cui il proprio modello è riuscito a scalare le classifiche internazionali.
Al di là dei numeri, Baidu ha messo l’accento sulle capacità qualitative del modello. Sono stati evidenziati progressi nella comprensione multimodale, nella programmazione e nella scrittura creativa, oltre a una maggiore capacità di mantenere il contesto e produrre contenuti complessi. Un esempio particolarmente emblematico è stato la generazione del “Piano di ristrutturazione patrimoniale di Daegwanwon”, un testo che imita lo stile letterario del classico cinese Il sogno della camera rossa integrandolo con una moderna logica aziendale. Questo tipo di dimostrazione mira a mostrare non solo la competenza tecnica del modello, ma anche la sua versatilità culturale e creativa.
Lo sviluppo di ERNIE 5.0 non è stato il lavoro di un team ristretto. Baidu ha dichiarato che 835 esperti provenienti da settori come tecnologia, finanza, cultura, istruzione, medicina ed energia, oltre a discipline accademiche come matematica, fisica, letteratura e filosofia, hanno contribuito al progetto. Il loro ruolo è stato quello di verificare il rigore logico, la solidità delle conoscenze, la qualità creativa e la coerenza dei valori espressi dal modello, un aspetto che riflette l’importanza crescente attribuita all’allineamento e all’affidabilità dei sistemi di AI avanzati.
