KinDER : Un benchmark de raisonnement physique pour l'apprentissage et la planification robotiques

Résumé

Les systèmes robotiques qui interagissent avec le monde physique doivent raisonner sur les contraintes cinématiques et dynamiques imposées par leur propre incarnation, leur environnement et la tâche à accomplir. Nous présentons KinDER, un benchmark pour le raisonnement incarné cinématique et dynamique qui cible les défis de raisonnement physique rencontrés dans l'apprentissage et la planification robotiques. KinDER comprend 25 environnements générés de manière procédurale, une bibliothèque Python compatible Gymnasium avec des compétences paramétrables et des démonstrations, ainsi qu'une suite d'évaluation standardisée avec 13 lignes de base implémentées couvrant la planification de tâches et de mouvements, l'apprentissage par imitation, l'apprentissage par renforcement et les approches basées sur des modèles fondateurs. Les environnements sont conçus pour isoler cinq défis fondamentaux de raisonnement physique : les relations spatiales de base, la manipulation non préhensile multi-objets, l'utilisation d'outils, les contraintes géométriques combinatoires et les contraintes dynamiques, distincts de la perception, de la compréhension du langage et de la complexité spécifique aux applications. L'évaluation empirique montre que les méthodes existantes peinent à résoudre nombre de ces environnements, révélant des lacunes importantes dans les approches actuelles du raisonnement physique. Nous incluons également des expériences réel-simulé-réel sur un manipulateur mobile pour évaluer la correspondance entre la simulation et l'interaction physique dans le monde réel. KinDER est entièrement open-source et vise à permettre une comparaison systématique entre divers paradigmes pour faire progresser le raisonnement physique en robotique. Site web et code : https://prpl-group.com/kinder-site/

English

Robotic systems that interact with the physical world must reason about kinematic and dynamic constraints imposed by their own embodiment, their environment, and the task at hand. We introduce KinDER, a benchmark for Kinematic and Dynamic Embodied Reasoning that targets physical reasoning challenges arising in robot learning and planning. KinDER comprises 25 procedurally generated environments, a Gymnasium-compatible Python library with parameterized skills and demonstrations, and a standardized evaluation suite with 13 implemented baselines spanning task and motion planning, imitation learning, reinforcement learning, and foundation-model-based approaches. The environments are designed to isolate five core physical reasoning challenges: basic spatial relations, nonprehensile multi-object manipulation, tool use, combinatorial geometric constraints, and dynamic constraints, disentangled from perception, language understanding, and application-specific complexity. Empirical evaluation shows that existing methods struggle to solve many of the environments, indicating substantial gaps in current approaches to physical reasoning. We additionally include real-to-sim-to-real experiments on a mobile manipulator to assess the correspondence between simulation and real-world physical interaction. KinDER is fully open-sourced and intended to enable systematic comparison across diverse paradigms for advancing physical reasoning in robotics. Website and code: https://prpl-group.com/kinder-site/

KinDER : Un benchmark de raisonnement physique pour l'apprentissage et la planification robotiques

KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning

Résumé

Support