Un cervello digitale intelligente, capace di ragionare, risolvere problemi matematici, generare codice e gestire compiti complessi — senza richiedere hardware costosi o dipendere da licenze proprietarie. È la visione dietro l’ERNIE-4.5-21B-A3B-Thinking, l’ultima incarnazione dei modelli linguistici di Baidu, progettata per essere accessibile, potente e aperta a tutti.
ERNIE-4.5-21B-A3B-Thinking è il nuovo modello della serie ERNIE-4.5, offerto con licenza Apache 2.0. Questo significa che le aziende e gli sviluppatori possono utilizzarlo liberamente, personalizzarlo e adattarlo a progetti commerciali senza dover trattare con barriere legali o costi aggiuntivi.
Il suo punto di forza? Non è la potenza bruta — richiede solo 3 miliardi dei 21 miliardi di parametri per ogni token, garantendo performance efficienti anche su hardware più contenuto.
ERNIE-4.5-21B-A3B-Thinking non è un modello generico: è studiato per compiti sofisticati. Eccelle in ambiti come:
- logica strutturata e deduttiva,
- matematica e ragionamento scientifico,
- generazione di codice e uso intelligente di strumenti tramite chiamate di funzioni esterne.
Questa specializzazione si riflette nei benchmark: ottiene un 89.8 su ZebraLogic, 87.77 su BBH, 86.5 su WritingBench, e supera il 90% nei test di codifica come HumanEval+ e oltre l’80% in MBPP.
Nonostante appartenga a una famiglia di modelli con fino a 424 miliardi di parametri, il modello da 21B è pensato per equilibrio ed efficienza. Inoltre, supporta finestre di contesto fino a 128.000 token — pari a quelle di modelli di punta americani, pur restando meno esoso in termini di risorse.
Sul fronte tecnico, spiccano l’architettura Mixture-of-Experts (MoE), il supporto per PaddlePaddle e l’uso di strumenti come ERNIEKit e FastDeploy per lo sviluppo e l’inferenza efficiente.
Con ERNIE-4.5, Baidu non solo rinnova il suo portfolio LLM, ma lancia un segnale chiaro: open source è il nuovo mainstream. In un mercato sempre più competitivo, questa scelta sfida l’approccio chiuso e a pagamento, favorendo l’adozione da parte di aziende, università e sviluppatori indipendenti.
L’accessibilità del modello si combina con una compatibilità tecnica robusta: ERNIE-4.5 può essere integrato facilmente grazie al supporto per FastDeploy, vLLM, Transformers e altri ecosistemi, facilitando l’inserimento in infrastrutture cloud ibride o pipeline di produzione.