Hy3 è la versione preview del modello di nuova generazione sviluppato da Tencent sotto la guida tecnica di esperti del calibro di Yao Sun-hui. A differenza della corsa al trilione di parametri intrapresa da altri laboratori cinesi, Hy3 si distingue per una “ricostruzione” strutturale del sistema Hunyuan, mirata a ottimizzare il rapporto tra costi computazionali e usabilità pratica. Con un totale di 295 miliardi di parametri, il modello adotta un’architettura Mixed Expert (MoE) estremamente raffinata, in grado di attivare solamente 21 miliardi di parametri per ogni singolo calcolo. Questa configurazione permette di abbattere drasticamente la latenza e i costi operativi, mantenendo al contempo una capacità di elaborazione del contesto che raggiunge i 256.000 token, sufficienti per analizzare interi volumi di testo in un unico passaggio.
Il salto qualitativo di Hy3 emerge con chiarezza nelle metriche dedicate alla risoluzione di problemi tecnici e alla programmazione software. Nel benchmark SWE-Bench Verified, focalizzato sulla correzione automatica di bug, il modello ha registrato un incremento di efficacia senza precedenti, passando dal 53% della precedente versione Hy2 a un solido 74,4%. Analogamente, le capacità operative in ambienti basati su terminale e comandi di sistema sono più che raddoppiate, come dimostrato dal test Terminal-Bench, mentre le prestazioni degli agenti IA nella navigazione web hanno raggiunto il 67,1%. Questi dati non indicano solo una maggiore potenza di calcolo, ma una migliore comprensione della logica sequenziale necessaria per agire come un vero agente autonomo, capace di gestire flussi di lavoro complessi che si articolano fino a 495 passaggi consecutivi senza perdere la coerenza operativa.
Oltre alle capacità agentiche, Hy3 ha dimostrato una spiccata attitudine al ragionamento logico-matematico di alto livello. I test condotti sull’esame di qualificazione al dottorato in matematica dell’Università di Tsinghua hanno visto il modello raggiungere una media di 88,4 punti, posizionandosi ai vertici della categoria tra i modelli sviluppati in Cina. Risultati eccellenti sono stati ottenuti anche nelle simulazioni delle Olimpiadi di biologia, a conferma di una metodologia di addestramento che Tencent dichiara essere orientata alla risoluzione di problemi reali piuttosto che alla semplice ottimizzazione per i punteggi di riferimento. La velocità con cui il modello è stato sviluppato e rilasciato — poco più di tre mesi dall’inizio del progetto — sottolinea inoltre l’efficacia della revisione infrastrutturale operata dall’azienda sui propri sistemi di apprendimento accelerato.
La strategia di rilascio scelta da Tencent punta con decisione sull’accessibilità e sull’integrazione immediata nel mercato B2B e consumer. Hy3 Preview è stato infatti distribuito come software open source su piattaforme come GitHub e HuggingFace, rendendo le sue capacità disponibili globalmente tramite API su Tencent Cloud a prezzi competitivi. All’interno dell’ecosistema proprietario, il modello è già operativo in strumenti chiave come il chatbot Yuanbao, l’assistente al coding CodeBuddy e le piattaforme di produttività aziendale WorkBuddy e Tencent Docs. Sebbene il modello non sia stato progettato per competere direttamente con i giganti assoluti in termini di scala globale, la sua architettura ottimizzata lo posiziona come una delle soluzioni più avanzate per lo sviluppo di agenti IA efficienti, pronti per l’implementazione su larga scala in scenari aziendali ad alta complessità.
