Eureka: La Rivoluzionaria AI di Nvidia Formata da GPT-4

Nvidia Research ha rivelato la sua recente invenzione: un agente AI di nome Eureka, progettato sulla base della tecnologia GPT-4 di OpenAI. Questa novità rappresenta un salto qualitativo nel campo dell’addestramento di robot a svolgere mansioni complesse.

Eureka si distingue in particolare per la sua capacità di generare in autonomia algoritmi di ricompensa. Grazie a ciò, è riuscito a formare una mano robotica affinché potesse compiere movimenti acrobatici, come girare rapidamente una penna o manipolare oggetti come le forbici. In totale, Eureka ha impartito lezioni su quasi 30 diverse attività.

Sfide dell’Apprendimento per Rinforzo

Anima Anandkumar, una figura chiave nel team di ricerca di Nvidia, ha evidenziato che, nonostante i progressi dell’ultimo decennio nell’apprendimento per rinforzo, le sfide persistono. Una di queste è la creazione degli algoritmi di ricompensa, che spesso risulta essere un processo di tentativo ed errore. Eureka rappresenta un’avanzata significativa in questo settore, fondendo metodi di apprendimento generativo e di rinforzo per affrontare problemi intricati.

Per estendere l’utilizzo e la sperimentazione di Eureka, Nvidia Research ha reso disponibile una libreria specifica di algoritmi. Questa può essere esplorata attraverso Nvidia Isaac Gym, un’app di simulazione fisica, che opera sulla piattaforma Nvidia Omniverse.

Continuità nell’Innovazione di Nvidia

La febbre per gli agenti IA è palpabile e Nvidia non è nuova a questo mondo. Precedentemente avevano introdotto Voyager, un altro agente basato su GPT-4, specializzato nel gioco Minecraft. Jeff Clune, un esperto del settore, ha sottolineato l’importanza e le potenzialità economiche di tali innovazioni, ma ha anche messo in luce le possibili ripercussioni a livello sociale.

Eureka Supera le Aspettative

Un recente studio ha messo in risalto le capacità straordinarie di Eureka nell’usare le competenze zero-shot e nella scrittura di codice. Questo gli ha permesso di generare funzioni di ricompensa che superano quelle ideate da esperti del settore. In una varietà di ambienti di apprendimento per rinforzo, Eureka ha mostrato performance superiori all’83% rispetto alle soluzioni umane.

Concludendo, Jim Fan, membro senior del team di Nvidia, ha enfatizzato la singolarità di Eureka, descrivendolo come una fusione tra modelli linguistici avanzati e tecnologie di simulazione potenziate da GPU Nvidia. Questo non solo rivoluzionerà il controllo dei robot ma potrebbe anche offrire nuove opportunità nel mondo delle animazioni.

Di ihal