DeepSeek ha annunciato che il taglio del 75% sui prezzi API del modello “V4-Pro”, inizialmente introdotto come promozione temporanea, diventerà permanente. La decisione riguarda uno dei modelli di punta dell’azienda cinese e rappresenta un ulteriore segnale dell’intensificazione della guerra dei prezzi nel mercato AI asiatico, dove i principali operatori stanno cercando di conquistare quote di mercato attraverso una drastica riduzione dei costi di inferenza.
Secondo le informazioni diffuse dall’azienda, i costi per milione di token vengono abbassati fino a livelli estremamente competitivi, con tariffe particolarmente aggressive per i token in cache. Questo elemento è strategicamente importante perché molte applicazioni enterprise e agentiche riutilizzano frequentemente contesti già elaborati, cronologie conversazionali estese o documentazione ripetitiva. Ridurre il prezzo delle cache hit permette quindi di abbattere significativamente il costo operativo di chatbot avanzati, sistemi RAG, coding assistant e workflow multi-step ad alto consumo computazionale.
La mossa di DeepSeek si differenzia da altre iniziative viste recentemente nel mercato cinese. Mentre aziende come Alibaba e Baidu hanno ridotto soprattutto i prezzi dei modelli intermedi o lightweight, DeepSeek ha applicato la strategia anche a un modello flagship con circa 1,6 trilioni di parametri, cercando di posizionarsi come alternativa ad alte prestazioni ma economicamente sostenibile rispetto ai modelli occidentali premium.
Il tema centrale non riguarda soltanto il prezzo assoluto, ma il possibile impatto strutturale sull’intero ecosistema AI. Ridurre drasticamente i costi API abbassa infatti la barriera economica per startup, sviluppatori indipendenti e aziende che vogliono integrare agenti AI complessi o sistemi multimodali in produzione. In particolare, i modelli con costi inferiori favoriscono applicazioni continue e persistenti, dove il numero di chiamate API può crescere rapidamente fino a generare spese operative molto elevate.
L’annuncio arriva inoltre in un momento in cui il settore cinese dell’AI sta accelerando la competizione sia sul piano dell’efficienza hardware sia su quello della produzione locale di acceleratori. DeepSeek aveva già indicato in passato che i limiti di capacità computazionale influenzavano il prezzo delle versioni più avanzate del modello, suggerendo che l’aumento della disponibilità di chip AI e l’ottimizzazione delle infrastrutture potrebbero aver contribuito alla nuova politica tariffaria.
Questa dinamica potrebbe avere effetti anche sul mercato globale. La crescente pressione competitiva proveniente dalla Cina rischia infatti di comprimere ulteriormente i margini dei provider occidentali, spingendo il settore verso un modello in cui la differenziazione non dipenderà più soltanto dalla qualità del modello, ma anche dall’efficienza economica dell’infrastruttura, dalla gestione della cache, dalla latenza e dall’ottimizzazione dei consumi computazionali.
