NVIDIA: addestramento post training ed inferenza richiedono più risorse computazionali rispetto all’addestramento preliminare
NVIDIA ha recentemente evidenziato come l’addestramento posteriore e l’inferenza richiedano risorse computazionali significativamente superiori rispetto all’addestramento preliminare dei modelli IA. Questa analisi offre una nuova prospettiva sulla distribuzione delle risorse…
OpenAI vs xAI: accuse di manipolazione nei benchmark di Grok-3
Il mondo dell’intelligenza artificiale è stato scosso da una controversia tra OpenAI e xAI, l’azienda fondata da Elon Musk. Al centro del dibattito vi sono le accuse di manipolazione dei…
Apple integra anche Google Gemini in Siri
Apple ha intrapreso un passo significativo integrando il modello Gemini di Google nel suo assistente vocale, Siri. Questa mossa strategica mira a potenziare le capacità di Siri, offrendo agli utenti…
DeepSeek lancia FlashMLA: un kernel di decodifica MLA per GPU Hopper
DeepSeek ha inaugurato la sua “Settimana Open Source” con il rilascio di FlashMLA. Questo kernel di decodifica è stato progettato specificamente per le GPU Hopper, ottimizzando l’elaborazione di sequenze a…