DeepSeek, startup cinese emergente, ha recentemente annunciato una serie di iniziative volte a consolidare la sua posizione di rilievo nel settore. Tra queste, spiccano sconti sostanziali sui servizi API dei suoi modelli di ragionamento e l’accelerazione del lancio del nuovo modello R2, previsto ora prima di maggio.
DeepSeek ha comunicato che offrirà sconti significativi sulla sua piattaforma API durante le fasce orarie non di punta, specificamente dalle 16:30 alle 00:30 ogni giorno. In questo intervallo, il costo per l’utilizzo del modello DeepSeek-V3 sarà ridotto del 50%, mentre per il modello DeepSeek-R1 la riduzione sarà del 75%. Questa strategia mira a rendere l’accesso ai potenti strumenti di ragionamento AI più conveniente per sviluppatori e aziende, incentivando l’adozione su larga scala.
Inizialmente previsto per l’inizio di maggio, il lancio del nuovo modello di ragionamento DeepSeek R2 è stato anticipato a una data più prossima, sebbene non specificata. Questa decisione riflette l’impegno di DeepSeek nel rispondere rapidamente alle esigenze del mercato e nel mantenere un vantaggio competitivo. Il modello R2 promette miglioramenti nelle capacità di codifica e un’estensione delle funzionalità di ragionamento a lingue diverse dall’inglese, ampliando così le sue applicazioni a livello globale.
Nonostante le iniziative promettenti, DeepSeek ha affrontato recentemente alcune difficoltà tecniche. La piattaforma API ha registrato problemi, tra cui un’interruzione continuativa di 10 giorni e la sospensione temporanea delle ricariche API per gli sviluppatori. Questi incidenti evidenziano le sfide operative che l’azienda deve superare per garantire un servizio affidabile e continuo ai propri utenti.
Parallelamente, DeepSeek ha rafforzato il suo impegno verso la comunità open source. Durante la “settimana dell’open source”, l’azienda ha lanciato il suo terzo repository, DeepGEMM, una libreria FP8 GEMM ottimizzata per calcoli densi e Mixture of Experts (MoE). Questa libreria offre oltre 1350 TFLOPS FP8 su GPU NVIDIA Hopper, rappresentando un significativo avanzamento nelle risorse disponibili per la comunità di sviluppatori e ricercatori.