DeepSeek raddoppia le tariffe API nelle ore di punta per i modelli V4

DeepSeek introdurrà una tariffazione differenziata per l’accesso API ai modelli della famiglia V4, applicando un costo doppio nelle fasce orarie di maggiore utilizzo. La misura riguarderà gli utenti che integrano i modelli nelle proprie applicazioni, nei workflow aziendali o nei prodotti basati su inferenza testuale, e sarà attivata con il rilascio della versione ufficiale di V4 previsto a metà luglio.

Per DeepSeek-V4 Pro, il prezzo dell’output passerà da 6 yuan a 12 yuan per milione di token durante le ore di picco. Le fasce interessate corrispondono, secondo l’orario di Pechino, alla mattina tra le 9 e le 12 e al pomeriggio tra le 14 e le 18. Al di fuori di questi intervalli resterà applicata la tariffa ordinaria. Il criterio non riguarda quindi la qualità o la tipologia di richiesta inviata al modello, ma il momento in cui l’inferenza viene eseguita e la pressione esercitata sulle risorse disponibili.

La scelta introduce una logica tipica dei servizi infrastrutturali ad alta intensità di calcolo: quando le richieste aumentano simultaneamente, mantenere tempi di risposta ridotti e capacità stabile richiede più potenza di elaborazione, maggiore disponibilità di acceleratori e una gestione più rigida della coda di inferenza. Nei modelli linguistici di grandi dimensioni, il costo non dipende soltanto dai token generati, ma anche dalla necessità di riservare memoria, banda e capacità GPU per servire molte sessioni contemporanee senza degradare latenza e affidabilità.

Per gli sviluppatori, il nuovo schema rende più importante la progettazione dei flussi API. Applicazioni che inviano richieste non urgenti, processi batch, generazione di contenuti programmata, classificazioni massive o analisi documentali possono essere spostati nelle ore non di punta per contenere la spesa. I servizi in tempo reale, invece, dovranno valutare l’impatto della tariffazione sulla marginalità del prodotto, sui limiti di utilizzo assegnati agli utenti e sulle eventuali strategie di fallback verso modelli alternativi.

Il passaggio è rilevante anche perché DeepSeek aveva adottato pochi mesi prima una riduzione molto aggressiva dei prezzi di V4, contribuendo ad alimentare la concorrenza sul costo dei modelli AI nel mercato cinese. Il ritorno a una maggiorazione selettiva segnala che la riduzione dei prezzi può favorire l’adozione e il volume di utilizzo, ma non elimina il costo infrastrutturale associato ai picchi di domanda. Per i fornitori di AI, la sostenibilità dell’offerta passa quindi sempre più dalla gestione dinamica della capacità, oltre che dalla competizione sul prezzo nominale per token.

DeepSeek raddoppia le tariffe API nelle ore di punta per i modelli V4

DiFantasy

Di Fantasy

Articoli correlati

OpenAI annuncia Presence, per l’implementazione degli Agenti AI nelle aziende

Ford integrerà Apple Maps nella piattaforma elettrica e nel futuro sistema BlueCruise

OpenAI trasforma ChatGPT e Codex in marchi lifestyle con Supply Co.

Ultimi Post

OpenAI annuncia Presence, per l’implementazione degli Agenti AI nelle aziende

Ford integrerà Apple Maps nella piattaforma elettrica e nel futuro sistema BlueCruise

OpenAI trasforma ChatGPT e Codex in marchi lifestyle con Supply Co.

ElevenLabs aggiunge References e Vocals al generatore musicale Music v2, per riferimenti audio e voci riutilizzabili