L’annuncio del modello di anteprima Hy3 da parte di Tencent ha sollevato un dibattito tecnico e geostrategico di notevole rilevanza, mettendo in luce le complesse dinamiche di sviluppo che intercorrono tra le big tech cinesi e i laboratori di ricerca statunitensi. Sebbene Hy3 sia stato accolto con favore dalla comunità degli sviluppatori per le sue prestazioni nel campo della programmazione, l’emergere di dettagli riguardanti l’uso di Claude e Claude Code di Anthropic durante le fasi cruciali del suo perfezionamento ha innescato una serie di riflessioni sull’etica dello sviluppo e sul rispetto delle restrizioni commerciali internazionali. Il progetto, che vede la firma scientifica di Yao Sun-hun, ex ricercatore OpenAI, rappresenta per Tencent un tentativo strategico di colmare il divario tecnologico con competitor diretti quali Alibaba e ByteDance, ma la sua genesi tecnica solleva interrogativi sull’autonomia dei processi di apprendimento.
Il cuore della controversia risiede nell’impiego del codice e delle risposte generate da Claude durante la fase di Apprendimento per Rinforzo basato sul Feedback Umano, nota tecnicamente come RLHF. Durante questo processo, i valutatori interni di Tencent hanno utilizzato il modello di Anthropic come termine di paragone qualitativo per affinare le risposte di Hy3. In pratica, gli specialisti hanno sottoposto gli stessi quesiti di programmazione a entrambi i modelli, utilizzando i risultati prodotti da Claude come standard di eccellenza per orientare il miglioramento delle capacità logiche e sintattiche del sistema cinese. Questo metodo permette di ottimizzare il comportamento del modello in fase di inferenza senza necessariamente procedere a un addestramento massivo da zero, riducendo drasticamente i tempi e i costi computazionali associati alla ricerca di soluzioni algoritmiche ottimali.
Tencent ha cercato di circoscrivere la portata tecnica di questa interazione, distinguendo nettamente tra l’utilizzo dei dati a scopo di benchmarking e la pratica della distillazione. Nella distillazione dei modelli, i dati di output di un’architettura più potente vengono inseriti direttamente nel set di addestramento di un modello più piccolo o meno evoluto per trasferirne le capacità. L’azienda ha precisato che i dati di Claude non sono stati integrati nei dataset di training di Hy3, ma sono serviti esclusivamente come riferimento esterno per la valutazione umana delle prestazioni. Nonostante questa distinzione formale, nel settore permane la critica secondo cui l’uso sistematico di un modello concorrente come pietra di paragone rappresenti comunque uno sfruttamento indiretto della proprietà intellettuale e degli investimenti di ricerca di Anthropic, specialmente in un contesto in cui quest’ultima limita esplicitamente l’accesso ai propri servizi alle aziende basate in Cina per ragioni di sicurezza nazionale.
La questione assume una dimensione ancora più critica se si considera il regime restrittivo imposto da Anthropic, che vieta l’accesso a Claude alle filiali estere e alle società cinesi. Il fatto che i ricercatori di Tencent siano riusciti ad accedere a tali strumenti suggerisce l’impiego di metodi di aggiramento tecnologico, come l’uso di intermediari, numeri di telefono internazionali o sistemi di pagamento esteri. Questo scenario ha spinto Anthropic a potenziare ulteriormente i propri protocolli di sicurezza, introducendo verifiche dell’identità tramite documenti governativi e sistemi di riconoscimento facciale in tempo reale per bloccare l’uso non autorizzato dei propri modelli. La reazione del laboratorio statunitense, pur evitando attacchi diretti a Tencent, ha ribadito la ferma volontà di monitorare e neutralizzare ogni tentativo di “attacco di distillazione” o uso improprio volto all’addestramento di modelli competitivi.
Hy3 sembra aver capitalizzato efficacemente questa fase di ottimizzazione, posizionandosi già al nono posto nelle classifiche di utilizzo globale per quanto riguarda la programmazione. Gli sviluppatori ne lodano l’efficienza, sottolineando come la sua capacità di generare codice sia superiore a quella di molti modelli di dimensioni equivalenti. Questo successo operativo, tuttavia, rimane indissolubilmente legato alla discussione sulle modalità con cui è stato ottenuto. La capacità di trasformare il feedback comparativo in un vantaggio prestazionale concreto dimostra l’elevata competenza del team guidato da Yao Sun-hun, ma pone il modello Hy3 al centro di un delicato equilibrio tra innovazione indipendente e dipendenza metodologica dalle architetture di intelligenza artificiale sviluppate oltreoceano.
