DeepMind Gato può fare tutto

Diihal

Mag 20, 2022

Il modello generalista e multitasking di DeepMind, Gato, può fare tutto
Il principio di base seguito da Gato era di allenarsi utilizzando la più ampia gamma di dati possibile, comprese modalità come immagini, testo, pressione di pulsanti, coppie articolari e altre azioni basate sul contesto.

Con il numero crescente di modelli in lingua grande e un approccio multimodale alla formazione, DeepMind ha rilasciato una politica generalista multimodale , multitasking e multi-incarnazione chiamata Gato . L’unico agente generalista è stato addestrato utilizzando i dati di una varietà di attività e modalità in modo che la stessa rete con lo stesso peso possa fare qualsiasi cosa, da giocare ad Atari, scrivere didascalie per immagini, chattare e usare un braccio robotico per impilare blocchi per navigare ambienti 3D simulati. DeepMind ha anche pubblicato un documento intitolato “A Generalist Agent”, che descriveva il processo di formazione e le capacità del modello.

DeepMind Gato può fare tutto

Diihal

Di ihal

Articoli correlati

Arriva ModernBERT per l’elaborazione dell’NLP

Wayve AI LINGO-2: semplificare la guida autonoma con il linguaggio naturale

DUS Depth-Up Scaling rivoluzionario approccio per lo sviluppo di modelli linguistici avanzati

Ultimi Post

Conversazioni e Artifacts di Claude sono comparsi nei risultati di Google attraverso i link pubblici

OpenAI sospende il modello Erdős dopo ripetute evasioni della sandbox durante i test interni

Google AI Overviews compare ormai nel 43% delle ricerche e sposta gli utenti verso la ricerca conversazionale

Moonshot pubblica i pesi di Kimi K3 con una licenza commerciale basata sui ricavi