Nell’ambito della conferenza GTC del 2025, NVIDIA ha annunciato una serie di novità hardware e software. Tra queste, spicca l’introduzione dei modelli di ragionamento open source Llama Nemotron, progettati per accelerare i carichi di lavoro dell’intelligenza artificiale agentica. Questi modelli rappresentano un’estensione della famiglia Nemotron, presentata per la prima volta al Consumer Electronics Show (CES) nel gennaio dello stesso anno.

Gli agenti AI sono sistemi software autonomi progettati per ragionare, pianificare, agire e valutare il proprio operato. Simili agli esseri umani, necessitano di comprendere il contesto per scomporre richieste complesse, interpretare l’intento dell’utente e adattarsi in tempo reale. Kari Briski, vicepresidente della gestione dei prodotti di intelligenza artificiale generativa presso NVIDIA, ha sottolineato come questi agenti richiedano capacità di ragionamento avanzate per operare efficacemente.

Nel 2025 si è assistito a una crescita significativa dei modelli di ragionamento. NVIDIA ha affrontato questa evoluzione con il lancio della famiglia Llama Nemotron, offrendo modelli di intelligenza artificiale pronti per il business e orientati al ragionamento avanzato per agenti sofisticati.

I modelli Llama Nemotron si basano sui modelli open source Llama di Meta. NVIDIA ha ottimizzato questi modelli riducendo i requisiti computazionali senza compromettere l’accuratezza. La formazione ha coinvolto 360.000 ore di inferenza su H100 e 45.000 ore di annotazione umana, migliorando le capacità di ragionamento. Questo ha portato a modelli con prestazioni eccezionali in benchmark chiave per matematica, utilizzo di strumenti, comprensione delle istruzioni e compiti conversazionali.

La famiglia Llama Nemotron comprende tre modelli distinti, ciascuno ottimizzato per specifici scenari di implementazione:​

  • Nemotron Nano: ottimizzato per implementazioni edge e di piccole dimensioni, mantenendo un’elevata accuratezza nel ragionamento.​
  • Nemotron Super: bilanciato per un throughput ottimale e accuratezza su singole GPU in data center.​
  • Nemotron Ultra: progettato per la massima “accuratezza agentica” in ambienti multi-GPU nei data center.​

Le varianti Nano e Super sono già disponibili, mentre Nemotron Ultra sarà rilasciato nel secondo trimestre del 2025.

Di Fantasy