Alibaba ha presentato Qwen3-Coder, il suo modello di linguaggio open-source progettato per rivoluzionare il panorama della programmazione assistita dall’intelligenza artificiale. Con un’architettura avanzata e prestazioni eccezionali, Qwen3-Coder si propone come un alleato indispensabile per sviluppatori, ingegneri e ricercatori nel campo dell’AI.
Qwen3-Coder-480B-A35B-Instruct è costruito su un’architettura Mixture-of-Experts (MoE), composta da 480 miliardi di parametri totali, con 35 miliardi attivi per ogni inferenza. Questa struttura consente al modello di attivare solo una parte dei parametri necessari, ottimizzando l’efficienza computazionale. Con 62 strati e 160 esperti, di cui solo 8 attivati per ogni richiesta, Qwen3-Coder è progettato per gestire flussi di lavoro complessi in modo rapido ed efficace.
La capacità di gestire contesti fino a 256.000 token nativi e fino a 1 milione di token tramite la tecnica YaRN, derivata da RoPE, lo rende particolarmente adatto all’analisi e manipolazione di grandi basi di codice e documenti tecnici estesi.
Qwen3-Coder è stato addestrato utilizzando 7,5 trilioni di token, con il 70% di questi focalizzati su dati di codice. Questo approccio ha permesso al modello di sviluppare una comprensione profonda e dettagliata dei linguaggi di programmazione e delle strutture del codice. Inoltre, l’uso di tecniche avanzate di post-addestramento, come l’apprendimento per rinforzo basato sull’esecuzione (Code RL) e l’apprendimento per rinforzo a lungo termine (Long-Horizon Agent RL), ha migliorato ulteriormente le capacità del modello nell’affrontare compiti complessi e interazioni multi-turno.
Nei test di benchmark, Qwen3-Coder ha ottenuto risultati notevoli, superando modelli concorrenti come GPT-4.1 e Gemini 2.5 Pro Preview in vari compiti di codifica. In particolare, ha raggiunto una percentuale di risposte corrette del 67,0% nel benchmark SWE-Bench, avvicinandosi alle prestazioni di Claude Sonnet 4 (70,4%).
Essendo open-source e rilasciato sotto licenza Apache 2.0, Qwen3-Coder è liberamente accessibile e utilizzabile. Gli sviluppatori possono scaricarlo e integrarlo nei loro flussi di lavoro attraverso piattaforme come Hugging Face, GitHub, Qwen Chat e Qwen API. Inoltre, Alibaba ha rilasciato Qwen Code, uno strumento di programmazione open-source per terminali di sviluppo, che facilita l’integrazione di Qwen3-Coder nei flussi di lavoro di sviluppo tramite prompt strutturati e chiamate di funzione .
Le reazioni degli esperti e degli sviluppatori sono state entusiastiche. Jack Dorsey, co-fondatore di Twitter, ha testato la combinazione del suo framework di intelligenza artificiale “Goose” con Qwen3-Coder, esprimendo il suo entusiasmo con un semplice “Wow”. Sebastian Raschka, ricercatore statunitense specializzato in intelligenza artificiale, ha definito Qwen3-Coder “il miglior modello specifico per la programmazione mai rilasciato”, sottolineando che “i modelli specializzati prevalgono sui modelli generici” .