Il modello generalista e multitasking di DeepMind, Gato, può fare tutto
Il principio di base seguito da Gato era di allenarsi utilizzando la più ampia gamma di dati possibile, comprese modalità come immagini, testo, pressione di pulsanti, coppie articolari e altre azioni basate sul contesto.
Con il numero crescente di modelli in lingua grande e un approccio multimodale alla formazione, DeepMind ha rilasciato una politica generalista multimodale , multitasking e multi-incarnazione chiamata Gato . L’unico agente generalista è stato addestrato utilizzando i dati di una varietà di attività e modalità in modo che la stessa rete con lo stesso peso possa fare qualsiasi cosa, da giocare ad Atari, scrivere didascalie per immagini, chattare e usare un braccio robotico per impilare blocchi per navigare ambienti 3D simulati. DeepMind ha anche pubblicato un documento intitolato “A Generalist Agent”, che descriveva il processo di formazione e le capacità del modello.