Al SIGGRAPH 2025, NVIDIA ha presentato un significativo avanzamento nel campo della robotica e dell’intelligenza artificiale fisica con il lancio di Cosmos Reason, un modello di linguaggio visivo (VLM) open-source con 7 miliardi di parametri. Questo modello è progettato per consentire ai robot e agli agenti di intelligenza artificiale di ragionare come esseri umani, comprendendo il mondo reale attraverso conoscenze pregresse, leggi fisiche e buon senso.

Cosmos Reason è un modello multimodale che integra visione artificiale, linguaggio naturale e ragionamento fisico. È stato sviluppato per affrontare compiti complessi come l’interpretazione di ambienti sconosciuti, l’esecuzione di comandi complessi e la pianificazione di azioni in scenari reali. Grazie alla sua capacità di comprendere e applicare il buon senso fisico, Cosmos Reason può essere utilizzato in vari ambiti, tra cui la robotica, la sicurezza industriale e l’analisi video.

Oltre a Cosmos Reason, NVIDIA ha introdotto aggiornamenti significativi alla sua piattaforma Cosmos. In particolare, Cosmos Transfer-2 semplifica il processo di prompting e accelera la generazione di dati sintetici fotorealistici da scene di simulazione 3D. Questa versione aggiornata riduce il processo di distillazione del modello da 70 passaggi a uno solo, migliorando l’efficienza nella creazione di ambienti di addestramento virtuali. Inoltre, è stata presentata la nuova libreria Omniverse NuRec, che sfrutta il rendering neurale per la ricostruzione di ambienti 3D a partire da dati sensoriali, e la piattaforma Metropolis per l’intelligenza artificiale visiva, che facilita la creazione di ambienti virtuali per l’addestramento dei robot.

L’introduzione di Cosmos Reason rappresenta un passo avanti significativo nell’evoluzione dell’intelligenza artificiale fisica. Combinando capacità di ragionamento, comprensione fisica e linguaggio naturale, questo modello offre nuove opportunità per lo sviluppo di robot autonomi in grado di interagire in modo più naturale e sicuro con l’ambiente circostante. Le applicazioni potenziali includono la navigazione in ambienti complessi, la manipolazione di oggetti delicati e la risposta a situazioni impreviste, rendendo i robot più adattabili e utili in contesti reali.

Di Fantasy