Tencent ha annunciato il lancio di Hunyuan Turbo S, un modello di intelligenza artificiale progettato per offrire risposte più rapide rispetto ai concorrenti, in particolare al modello DeepSeek-R1. Questo sviluppo segna un passo significativo nella crescente competizione nel settore dell’IA in Cina.
Hunyuan Turbo S è stato progettato per ridurre il tempo di risposta, con un ritardo nella generazione della prima parola diminuito del 44% e una velocità di output raddoppiata rispetto ai modelli precedenti. Tencent descrive questo approccio come “pensiero veloce”, analogo all’intuizione umana, che consente risposte immediate rispetto al “pensiero razionale” più lento. Il modello combina catene di pensiero brevi e lunghe per risolvere problemi in modo efficiente.
Una delle innovazioni chiave di Hunyuan Turbo S è l’architettura ibrida mamba-transformer. Questa struttura ottimizza l’efficienza riducendo la complessità computazionale dei transformer tradizionali, minimizzando l’uso della cache KV e abbassando i costi di addestramento e inferenza. L’architettura mamba è particolarmente efficace nella gestione di sequenze lunghe, mantenendo al contempo la capacità dei transformer di catturare relazioni contestuali complesse. Tencent afferma che questa è la prima applicazione dell’architettura mamba in un modello MoE (Mixture of Experts) su larga scala.
Secondo i benchmark rilasciati da Tencent, Hunyuan Turbo S supera o eguaglia altri grandi modelli di linguaggio, tra cui DeepSeek-V3, Claude 3.5 Sonnet e GPT-4o, in compiti di matematica, programmazione e ragionamento. Questi risultati evidenziano la capacità del modello di affrontare una vasta gamma di applicazioni con elevata efficienza e precisione.
Tencent ha reso Hunyuan Turbo S disponibile attraverso il sito ufficiale di Tencent Cloud, con accesso tramite API. Il modello è offerto a un prezzo competitivo: 0,8 yuan (circa 0,11 dollari) per milione di token in input e 2 yuan (circa 0,28 dollari) per milione di token in output. Questa strategia di pricing aggressiva mira a rendere l’IA più accessibile a sviluppatori, startup e grandi aziende, promuovendo l’adozione diffusa della tecnologia.
Il lancio di Hunyuan Turbo S avviene in un momento di intensa competizione nell’ecosistema dell’IA cinese. DeepSeek, una startup emergente, ha recentemente guadagnato attenzione con il suo modello DeepSeek-R1, noto per le sue elevate prestazioni e costi di sviluppo relativamente bassi. Questo ha spinto giganti tecnologici come Tencent e Alibaba ad accelerare i loro sforzi nel campo dell’IA. Alibaba, ad esempio, ha presentato in anteprima il modello di ragionamento Qwen QwQ-Max e ha annunciato un investimento di 52 miliardi di dollari in infrastrutture AI nei prossimi tre anni.
In risposta, Tencent ha intensificato i propri investimenti e innovazioni, come dimostra il lancio di Hunyuan Turbo S. Questa competizione è indicativa di un mercato in rapida evoluzione, dove l’innovazione e l’efficienza sono fondamentali per mantenere la leadership.