DeepSeek lancia FlashMLA: un kernel di decodifica MLA per GPU Hopper
DeepSeek ha inaugurato la sua “Settimana Open Source” con il rilascio di FlashMLA. Questo kernel di decodifica è stato progettato specificamente per le GPU Hopper, ottimizzando l’elaborazione di sequenze a…