ChatPaper.aiChatPaper

SIMA 2 : Un agent incarné généraliste pour les mondes virtuels

SIMA 2: A Generalist Embodied Agent for Virtual Worlds

December 4, 2025
papers.authors: SIMA team, Adrian Bolton, Alexander Lerchner, Alexandra Cordell, Alexandre Moufarek, Andrew Bolt, Andrew Lampinen, Anna Mitenkova, Arne Olav Hallingstad, Bojan Vujatovic, Bonnie Li, Cong Lu, Daan Wierstra, Daniel P. Sawyer, Daniel Slater, David Reichert, Davide Vercelli, Demis Hassabis, Drew A. Hudson, Duncan Williams, Ed Hirst, Fabio Pardo, Felix Hill, Frederic Besse, Hannah Openshaw, Harris Chan, Hubert Soyer, Jane X. Wang, Jeff Clune, John Agapiou, John Reid, Joseph Marino, Junkyung Kim, Karol Gregor, Kaustubh Sridhar, Kay McKinney, Laura Kampis, Lei M. Zhang, Loic Matthey, Luyu Wang, Maria Abi Raad, Maria Loks-Thompson, Martin Engelcke, Matija Kecman, Matthew Jackson, Maxime Gazeau, Ollie Purkiss, Oscar Knagg, Peter Stys, Piermaria Mendolicchio, Raia Hadsell, Rosemary Ke, Ryan Faulkner, Sarah Chakera, Satinder Singh Baveja, Shane Legg, Sheleem Kashem, Tayfun Terzi, Thomas Keck, Tim Harley, Tim Scholtes, Tyson Roberts, Volodymyr Mnih, Yulan Liu, Zhengdong Wang, Zoubin Ghahramani
cs.AI

papers.abstract

Nous présentons SIMA 2, un agent incarné généraliste qui comprend et agit dans une grande variété de mondes virtuels en 3D. Construit sur un modèle de base Gemini, SIMA 2 représente une avancée significative vers une interaction active et orientée vers un but au sein d'un environnement incarné. Contrairement aux travaux antérieurs (par exemple, SIMA 1) limités à des commandes langagières simples, SIMA 2 agit comme un partenaire interactif, capable de raisonner sur des objectifs de haut niveau, de converser avec l'utilisateur et de traiter des instructions complexes données par le langage et des images. Sur un portefeuille diversifié de jeux, SIMA 2 réduit considérablement l'écart avec les performances humaines et démontre une généralisation robuste à des environnements non vus auparavant, tout en conservant les capacités de raisonnement fondamentales du modèle de base. De plus, nous démontrons une capacité d'auto-amélioration ouverte : en exploitant Gemini pour générer des tâches et fournir des récompenses, SIMA 2 peut apprendre de manière autonome de nouvelles compétences à partir de zéro dans un nouvel environnement. Ce travail valide une voie vers la création d'agents polyvalents et d'apprentissage continu pour les mondes virtuels et, à terme, physiques.
English
We introduce SIMA 2, a generalist embodied agent that understands and acts in a wide variety of 3D virtual worlds. Built upon a Gemini foundation model, SIMA 2 represents a significant step toward active, goal-directed interaction within an embodied environment. Unlike prior work (e.g., SIMA 1) limited to simple language commands, SIMA 2 acts as an interactive partner, capable of reasoning about high-level goals, conversing with the user, and handling complex instructions given through language and images. Across a diverse portfolio of games, SIMA 2 substantially closes the gap with human performance and demonstrates robust generalization to previously unseen environments, all while retaining the base model's core reasoning capabilities. Furthermore, we demonstrate a capacity for open-ended self-improvement: by leveraging Gemini to generate tasks and provide rewards, SIMA 2 can autonomously learn new skills from scratch in a new environment. This work validates a path toward creating versatile and continuously learning agents for both virtual and, eventually, physical worlds.
PDF91December 6, 2025