NVIDIA ha presentato il modello linguistico avanzato Llama Nemotron Super v1.5, un’innovativa intelligenza artificiale progettata per affrontare compiti complessi come il ragionamento matematico, la generazione di codice e l’esecuzione di agenti intelligenti. Questo modello rappresenta un significativo passo avanti nell’equilibrio tra potenza computazionale e accessibilità, grazie alla sua capacità di operare in modo efficiente su una singola GPU NVIDIA H100.
Llama Nemotron Super v1.5 è stato sviluppato a partire dal modello open source Meta Llama 3.3 70B Instruct, utilizzando tecniche avanzate di ottimizzazione come la Neural Architecture Search (NAS). Questa metodologia ha permesso di ridurre il footprint del modello, consentendo l’esecuzione su hardware meno potente senza compromettere le prestazioni. Inoltre, è stato sottoposto a un processo di post-addestramento che ha incluso il fine-tuning supervisionato su dati relativi a matematica, scienze, programmazione e chiamate a funzioni, nonché l’uso di tecniche di Reinforcement Learning (RPO, RLVR e DPO) per affinare ulteriormente le capacità del modello.
Il modello ha ottenuto risultati eccezionali in vari benchmark di settore. Ad esempio, ha superato i modelli precedenti in test come MATH500, AIME 2024, GPQA, LiveCodeBench 24.10-25.02, BFCL v3 e Humanity’s Last Exam (Text-Only Subset). In particolare, ha raggiunto un tasso di successo dell’81,3% in scenari pratici, come l’uso di un robot UR10 con telecamera RealSense in ambienti complessi come carrelli della spesa e scaffali disordinati.
NVIDIA ha reso Llama Nemotron Super v1.5 disponibile come modello open source su Hugging Face, insieme a un set di dati contenente oltre 26 milioni di esempi sintetici generati da modelli come Qwen3-235B e DeepSeek R1. Questo approccio promuove la trasparenza e consente a sviluppatori e ricercatori di costruire su una base solida senza dover affrontare i costi e le complessità della raccolta di grandi quantità di dati.
Con la sua combinazione di alte prestazioni, efficienza e accessibilità, Llama Nemotron Super v1.5 si posiziona come una risorsa fondamentale per lo sviluppo di agenti intelligenti, chatbot avanzati e sistemi di recupero e generazione di informazioni (RAG). La possibilità di eseguire il modello su una singola GPU riduce significativamente i costi di implementazione, rendendo la tecnologia IA avanzata più accessibile a una vasta gamma di utenti e applicazioni.