公開URL:https://arxiv.org/abs/2205.06175
出典:Scott Reed, Konrad Zolna, Emilio Parisotto, Sergio Gomez Colmenarejo, Alexander Novikov, Gabriel Barth-Maron, Mai Gimenez, Yury Sulsky, Jackie Kay, Jost Tobias Springenberg, Tom Eccles, Jake Bruce, Ali Razavi, Ashley Edwards, Nicolas Heess, Yutian Chen, Raia Hadsell, Oriol Vinyals, Mahyar Bordbar, Nando de Freitas : A Generalist Agent, arXiv:2205.06175 (2022)
概要:マルチモーダル,マルチタスク,マルチエンボディメントの汎化ポリシーとして機能するGeneralist Agentを学習する.同じ重みをもつ単一のネットワークによって,Atariゲーム,画像キャプション生成, チャット,実世界のロボットアームの制御などを実行可能である.様々なタスクに対応可能なGeneralist Agentが学習可能であり,このAgentが僅かな追加データによってより多くのタスクに適応可能であることを示した.