La cinese Baidu ha lanciato un guanto di sfida di proporzioni epocali. Durante il suo evento annuale, il Baidu World 2025, il colosso tecnologico ha svelato il suo modello fondamentale di ultima generazione, ERNIE 5.0, posizionandolo immediatamente come un diretto e formidabile concorrente dei più avanzati sistemi occidentali, inclusi GPT-5 di OpenAI e Gemini di Google. Questo annuncio non rappresenta un semplice miglioramento incrementale, ma un vero e proprio salto di qualità strategico, che ridefinisce le ambizioni di Pechino nel dominio globale dell’AI.
Il cuore pulsante di ERNIE 5.0 è la sua natura intrinsecamente “omni-modale”. A differenza dei modelli linguistici tradizionali che eccellevano principalmente nell’elaborazione del testo, il nuovo sistema di Baidu è stato costruito da zero con una tecnologia di modellazione unificata e nativa, concepita per comprendere e generare congiuntamente una molteplicità di informazioni: non solo il linguaggio scritto, ma anche immagini, audio e video. Questa capacità di fusione sinergica dei sensi digitali conferisce a ERNIE 5.0 un livello di comprensione olistica della realtà ben superiore, ponendolo alla frontiera dell’innovazione con una base che vanta fino a 2.4 trilioni di parametri, un dato che ne sottolinea la potenza computazionale e la profondità di apprendimento.
La vera notizia, che ha catalizzato l’attenzione della comunità tecnologica, risiede tuttavia nelle affermazioni di Baidu riguardo alle prestazioni misurate. L’azienda ha mostrato risultati di benchmark dove ERNIE 5.0 (o le sue varianti più recenti, come il modello multimodale ERNIE 4.5-VL) non si limitano a competere, ma arrivano a superare i rivali internazionali, tra cui il GPT-5 ad alte prestazioni e il Gemini 2.5 Pro, in compiti cruciali di analisi multimodale. I grafici presentati hanno evidenziato una superiorità marcata in aree come l’analisi di dati complessi e non testuali. Ad esempio, il modello ha dimostrato una straordinaria efficacia nel comprendere e interpretare diagrammi, circuiti, schemi ingegneristici e, in generale, l’estrazione di conoscenza da immagini dense di informazioni, come le domande che combinano matematica e immagini (MathVista) o l’analisi di grafici e chart (ChartQA). Questa abilità di ragionamento visivo è fondamentale per sbloccare il valore nascosto in dati aziendali spesso ignorati dai modelli focalizzati esclusivamente sul testo, come feed video di fabbrica o scansioni mediche.
Oltre alla pura potenza di calcolo, ERNIE 5.0 presenta un upgrade completo delle sue capacità fondamentali, che spaziano dalla comprensione multimodale al ragionamento fattuale, dalla scrittura creativa alla pianificazione autonoma degli agent e all’uso intelligente degli strumenti. Le sue abilità logiche, di memoria e persino di persuasività sono state potenziate in modo significativo. Questo progresso tecnologico non è un esercizio accademico, ma ha immediate ripercussioni commerciali e strategiche. Il modello è già reso disponibile al pubblico attraverso ERNIE Bot e, per i clienti aziendali, tramite la piattaforma MaaS (Model as a Service) Qianfan di Baidu AI Cloud.
In un contesto geopolitico e commerciale sempre più teso, l’introduzione di un modello proprietario così potente e competitivo è un fattore di enorme rilevanza per l’industria tecnologica cinese. Affiancato dall’annuncio di nuovi chip Kunlun per l’addestramento e l’inferenza dell’AI, Baidu sta creando un ecosistema verticale e controllato a livello domestico, offrendo un’alternativa strategica alle tecnologie importate. Inoltre, l’impatto di ERNIE 5.0 si estende al cuore stesso dei servizi di Baidu: il classico motore di ricerca sta subendo una trasformazione aggressiva, evolvendo da un’applicazione basata su testo e link a una centrata sull’AI e sui rich media.
L’ambizione di ERNIE 5.0 è chiara: non solo competere, ma spingere i confini dell’intelligenza artificiale verso nuove vette, trasformando l’AI da un costo operativo in una fonte nativa di produttività e innovazione, e consolidando la posizione di Baidu come protagonista ineludibile nella corsa globale per la supremazia tecnologica.
