Il settore dei semiconduttori è diventato il centro della competizione globale sull’intelligenza artificiale. In questo scenario si inserisce la scelta di DeepSeek, una delle startup cinesi più promettenti nel campo dei modelli di IA, che ha deciso di utilizzare i chip Ascend di Huawei per l’addestramento di alcuni dei suoi modelli di nuova generazione. Una decisione che va oltre la tecnica: rappresenta un tassello della strategia cinese di ridurre la dipendenza dai fornitori stranieri e consolidare un ecosistema tecnologico autonomo.

Secondo quanto riportato da The Information, DeepSeek ha iniziato a impiegare i chip Ascend per addestrare modelli di piccole e medie dimensioni, mentre continua a usare i chip Nvidia per i modelli più potenti e avanzati. È una strategia ibrida che riflette il delicato equilibrio tra l’efficienza della tecnologia Nvidia e le pressioni del governo cinese, che spinge le aziende nazionali ad adottare soluzioni interne per rafforzare la propria indipendenza tecnologica.

L’adozione dei chip Huawei, tuttavia, non è stata indolore: secondo le indiscrezioni, avrebbe ritardato il lancio del modello R2, segno delle difficoltà legate alla transizione da un’infrastruttura ottimizzata per Nvidia a una nuova architettura ancora in fase di consolidamento.

Il recente rilascio del modello V3.1, lo scorso 20 del mese, ha sorpreso osservatori e analisti: presentato come un modello ibrido di inferenza, ha dimostrato prestazioni eccezionali ed è stato interpretato da alcuni come un possibile sostituto di R2. Tuttavia, DeepSeek sembra voler procedere su più binari, continuando a sviluppare R2 parallelamente e preparando anche varianti distillate.

Non è la prima volta che la startup segue questa strategia: al lancio di R1, DeepSeek aveva già diffuso sei versioni open source più leggere, tra cui i modelli “Qwon” e “Rama”, con parametri che spaziavano da 1,5 a 70 miliardi. Una molteplicità di approcci che le consente di rispondere a esigenze diversificate, dal mercato consumer alle applicazioni enterprise.

Il vero nodo non è soltanto hardware. Gran parte dell’industria cinese dell’IA è ancora fortemente legata all’ecosistema CUDA di Nvidia, robusto e consolidato. DeepSeek ha sperimentato questa dipendenza con il modello R1, ottimizzato proprio per le GPU americane.

Per questo motivo, la startup sta collaborando strettamente con gli ingegneri di Huawei per imparare a sfruttare al meglio il sistema software CANN e costruire metodi di addestramento ottimizzati per i chip Ascend. L’obiettivo è duplice: aumentare l’efficienza dei modelli e ridurre i costi, rendendo la tecnologia più competitiva e meno dipendente dall’estero.

Un tassello importante di questa strategia è il formato dati proprietario “UE8M0 FP8” di DeepSeek, progettato per garantire compatibilità sia con i chip Nvidia sia con quelli cinesi, ma con prestazioni superiori proprio sugli Ascend. È un chiaro segnale della direzione: rendere i modelli sempre più nativi per l’hardware nazionale.

Nonostante queste mosse, Nvidia resta la colonna portante del settore. Il suo CEO, Jensen Huang, ha recentemente sottolineato che la Cina rappresenta il secondo mercato informatico più grande al mondo, stimando per il 2024 un giro d’affari di 50 miliardi di dollari nei chip per IA, con una crescita prevista del 50% annuo.

Tuttavia, le scelte di DeepSeek potrebbero rappresentare un campanello d’allarme. Se sempre più aziende seguiranno la strada della sostituzione parziale o totale dei chip Nvidia con soluzioni locali, nel lungo periodo il dominio dell’azienda americana in Cina potrebbe essere messo in discussione.

Di Fantasy