Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

DiFantasy

Lug 1, 2025

Tencent ha recentemente introdotto Hunyuan-A13B, un modello linguistico di grandi dimensioni (LLM) open source che combina prestazioni elevate ed efficienza computazionale. Questo modello si distingue per l’adozione di un’architettura Mixture of Experts (MoE) sparsa, che attiva solo una parte dei suoi parametri durante l’inferenza, ottimizzando così l’uso delle risorse. Con un totale di 80 miliardi di parametri, Hunyuan-A13B ne attiva solo 13 miliardi alla volta, permettendo un’elaborazione più rapida e meno costosa.

Una delle caratteristiche principali di Hunyuan-A13B è la sua capacità di gestire contesti estremamente lunghi, fino a 256.000 token, grazie alla finestra di contesto estesa. Questo lo rende particolarmente adatto per applicazioni che richiedono l’elaborazione di testi lunghi e complessi.

Inoltre, il modello supporta modalità di ragionamento sia rapido che lento, consentendo agli utenti di scegliere il tipo di elaborazione in base alla complessità del compito. Questa flessibilità è particolarmente utile in scenari che richiedono un equilibrio tra velocità e accuratezza.

Hunyuan-A13B ha ottenuto risultati eccellenti in vari benchmark, tra cui BFCL-v3, ComplexFuncBench, MBPP e MultiPL-E, dimostrando la sua competitività rispetto ad altri modelli di grandi dimensioni. Ad esempio, ha raggiunto un punteggio di 78,3 in BFCL-v3 e 61,2 in ComplexFuncBench, superando modelli come DeepSeek-R1 e Qwen3-A22B in alcuni test.

Il modello è compatibile con framework come vLLM, SGLang e TensorRT-LLM, supportando formati di precisione come W16A16, W8A8 e FP8, e può raggiungere una velocità di elaborazione fino a 1981,99 token al secondo. Queste caratteristiche lo rendono adatto per applicazioni in tempo reale e per l’elaborazione di input di grandi dimensioni.

Tencent ha rilasciato Hunyuan-A13B su piattaforme come Hugging Face e GitHub, rendendolo accessibile alla comunità di sviluppatori e ricercatori. Questo rilascio open source rappresenta un passo significativo nell’impegno di Tencent nel promuovere l’innovazione nell’intelligenza artificiale e nel supportare la crescita dell’ecosistema open source.

Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

DiFantasy

Di Fantasy

Articoli correlati

Anthropic affronta la controversia politica con i nuovi parametri di imparzialità di Claude

Svelare la scatola nera: i Circuiti Sparsi di OpenAI per l’Intelligenza Artificiale trasparente

SIMA, l’Agente AI di Google DeepMind che impara e agisce in mondi 3D aperti

Ultimi Post

Anthropic affronta la controversia politica con i nuovi parametri di imparzialità di Claude

Svelare la scatola nera: i Circuiti Sparsi di OpenAI per l’Intelligenza Artificiale trasparente

SIMA, l’Agente AI di Google DeepMind che impara e agisce in mondi 3D aperti

L’illusione del 40%: Microsoft Copilot e il divario tra la percezione del management e la realtà del lavoro quotidiano