Immagine AI

DeepSeek introdurrà una tariffazione differenziata per l’accesso API ai modelli della famiglia V4, applicando un costo doppio nelle fasce orarie di maggiore utilizzo. La misura riguarderà gli utenti che integrano i modelli nelle proprie applicazioni, nei workflow aziendali o nei prodotti basati su inferenza testuale, e sarà attivata con il rilascio della versione ufficiale di V4 previsto a metà luglio.

Per DeepSeek-V4 Pro, il prezzo dell’output passerà da 6 yuan a 12 yuan per milione di token durante le ore di picco. Le fasce interessate corrispondono, secondo l’orario di Pechino, alla mattina tra le 9 e le 12 e al pomeriggio tra le 14 e le 18. Al di fuori di questi intervalli resterà applicata la tariffa ordinaria. Il criterio non riguarda quindi la qualità o la tipologia di richiesta inviata al modello, ma il momento in cui l’inferenza viene eseguita e la pressione esercitata sulle risorse disponibili.

La scelta introduce una logica tipica dei servizi infrastrutturali ad alta intensità di calcolo: quando le richieste aumentano simultaneamente, mantenere tempi di risposta ridotti e capacità stabile richiede più potenza di elaborazione, maggiore disponibilità di acceleratori e una gestione più rigida della coda di inferenza. Nei modelli linguistici di grandi dimensioni, il costo non dipende soltanto dai token generati, ma anche dalla necessità di riservare memoria, banda e capacità GPU per servire molte sessioni contemporanee senza degradare latenza e affidabilità.

Per gli sviluppatori, il nuovo schema rende più importante la progettazione dei flussi API. Applicazioni che inviano richieste non urgenti, processi batch, generazione di contenuti programmata, classificazioni massive o analisi documentali possono essere spostati nelle ore non di punta per contenere la spesa. I servizi in tempo reale, invece, dovranno valutare l’impatto della tariffazione sulla marginalità del prodotto, sui limiti di utilizzo assegnati agli utenti e sulle eventuali strategie di fallback verso modelli alternativi.

Il passaggio è rilevante anche perché DeepSeek aveva adottato pochi mesi prima una riduzione molto aggressiva dei prezzi di V4, contribuendo ad alimentare la concorrenza sul costo dei modelli AI nel mercato cinese. Il ritorno a una maggiorazione selettiva segnala che la riduzione dei prezzi può favorire l’adozione e il volume di utilizzo, ma non elimina il costo infrastrutturale associato ai picchi di domanda. Per i fornitori di AI, la sostenibilità dell’offerta passa quindi sempre più dalla gestione dinamica della capacità, oltre che dalla competizione sul prezzo nominale per token.

Di Fantasy