Nel panorama tecnologico attuale, numerose startup stanno mostrando un crescente interesse nell’adozione dei modelli di intelligenza artificiale (IA) avanzati di DeepSeek, in particolare le versioni ‘V3’ e ‘R1’. Questi modelli, noti per la loro efficienza e costi competitivi rispetto alle soluzioni tradizionali, stanno attirando l’attenzione di imprenditori desiderosi di integrare capacità IA nelle loro operazioni.

Numerosi fondatori di startup stanno rapidamente adottando i modelli di DeepSeek. Ali Ghodsi, CEO di Databricks, ha recentemente lanciato un servizio di hosting per i modelli di DeepSeek, affermando che l’interesse per ‘R1’ e ‘V3’ è “incredibile”. Ed Sim, fondatore della società di venture capital Boldstart, ha osservato che oggi un imprenditore può avviare un’attività altamente efficiente in termini di capitale con un account DeepSeek, un account Stripe per i pagamenti e un piccolo team.

Nonostante l’entusiasmo, l’implementazione pratica dei modelli di DeepSeek presenta diverse sfide. Una preoccupazione significativa riguarda la sicurezza dei dati, poiché le applicazioni e le API di DeepSeek trasmettono i dati degli utenti ai server in Cina, sollevando problemi di privacy per molte aziende. Per mitigare questo rischio, alcune organizzazioni stanno considerando l’implementazione on-premise dei modelli, scaricandoli e ospitandoli internamente. Tuttavia, questo approccio richiede competenze ingegneristiche avanzate.

Beepul Prakash, CEO di Together AI, che ospita modelli open-source, ha evidenziato che ‘DeepSeek-V3’ è particolarmente esigente in termini di risorse, richiedendo chip NVIDIA ‘H200’ con memoria aggiuntiva per un’esecuzione efficiente. Questi chip sono ancora più difficili da reperire rispetto agli ‘H100’. Inoltre, il modello utilizza un approccio chiamato “Mixture of Experts (MoE)”, che necessita di una distribuzione del traffico su decine di GPU, complicando ulteriormente l’implementazione.

Nonostante gli sforzi ingegneristici, i costi di hosting di Together AI, sebbene inferiori a quelli dei modelli di OpenAI, superano quelli dell’API diretta di DeepSeek. Inoltre, è previsto un aumento di quattro volte delle tariffe per l’utilizzo di ‘V3’ a partire dall’8 febbraio. Con l’aumento del traffico, è probabile che anche i costi di DeepSeek aumentino, mentre altre aziende potrebbero ridurre i prezzi delle loro API, riducendo i vantaggi competitivi di DeepSeek.

Un’analisi recente suggerisce che il successo di DeepSeek potrebbe essere attribuito alla loro capacità di ottimizzare l’uso delle GPU. Invece di utilizzare il software CUDA di NVIDIA, avrebbero impiegato una programmazione simile chiamata PTX (Parallel Thread Execution), riconfigurando le GPU ‘H800’ per migliorare le prestazioni. Questa ottimizzazione avanzata, sebbene complessa da implementare, riflette l’elevata competenza ingegneristica di DeepSeek e potrebbe essere stata una risposta strategica alla carenza di GPU, evidenziando gli sforzi della Cina per superare le limitazioni hardware attraverso soluzioni software innovative.

Di Fantasy