Alibaba ha presentato ufficialmente Qwen3, la nuova generazione del suo modello di intelligenza artificiale open source. Questa versione segna un significativo passo avanti rispetto ai predecessori, offrendo prestazioni superiori rispetto ai modelli concorrenti come OpenAI O1 e DeepSeek R1.
Qwen3 introduce un’architettura avanzata che combina modelli “mixture-of-experts” (MoE) e modelli densi. In totale, sono stati rilasciati otto nuovi modelli, tra cui la versione da 235 miliardi di parametri, denominata A22B. Questa versione ha superato i modelli concorrenti in benchmark chiave, come ArenaHard, che include 500 domande degli utenti in ingegneria del software e matematica. Inoltre, si avvicina alle prestazioni del nuovo modello proprietario di Google, Gemini 2.5-Pro.
Una delle caratteristiche distintive di Qwen3 è la sua capacità di “ragionamento ibrido” o “ragionamento dinamico”. Gli utenti possono alternare tra risposte rapide e precise e passaggi di ragionamento più lunghi e computazionalmente intensivi, simili alla serie O di OpenAI, per affrontare query più difficili in scienza, matematica, ingegneria e altri campi specializzati. Questa funzionalità è disponibile tramite l’interfaccia web di Qwen Chat o integrando specifici prompt come /think o /no_think durante l’implementazione del modello localmente o tramite API.
Tutti i modelli di Qwen3 sono disponibili con licenza open source Apache 2.0 e possono essere scaricati e utilizzati su piattaforme come Hugging Face, ModelScope, Kaggle e GitHub. Gli utenti possono interagire direttamente con i modelli tramite l’interfaccia web di Qwen Chat e le applicazioni mobili.
Il lancio di Qwen3 si inserisce in un contesto di crescente competizione nel settore dell’intelligenza artificiale tra le principali aziende tecnologiche cinesi e occidentali. Alibaba, insieme ad altri colossi tecnologici cinesi come Baidu e Tencent, sta intensificando i suoi sforzi per sviluppare modelli AI avanzati e open source, rispondendo alle restrizioni imposte dagli Stati Uniti sull’accesso a tecnologie avanzate. Questa strategia mira a decentralizzare lo sviluppo dell’IA, attingendo a talenti globali e riducendo i costi di sviluppo.