KinDER: Un punto de referencia de razonamiento físico para el aprendizaje y la planificación de robots

Resumen

Los sistemas robóticos que interactúan con el mundo físico deben razonar sobre las restricciones cinemáticas y dinámicas impuestas por su propia encarnación, su entorno y la tarea a realizar. Presentamos KinDER, un benchmark para el Razonamiento Encarnado Cinemático y Dinámico que aborda los desafíos de razonamiento físico que surgen en el aprendizaje y la planificación robóticos. KinDER comprende 25 entornos generados proceduralmente, una biblioteca de Python compatible con Gymnasium que incluye habilidades parametrizadas y demostraciones, y un conjunto de evaluación estandarizado con 13 líneas base implementadas que abarcan planificación de tareas y movimiento, aprendizaje por imitación, aprendizaje por refuerzo y enfoques basados en modelos fundacionales. Los entornos están diseñados para aislar cinco desafíos centrales de razonamiento físico: relaciones espaciales básicas, manipulación multiobjeto no prensil, uso de herramientas, restricciones geométricas combinatorias y restricciones dinámicas, desacoplados de la percepción, la comprensión del lenguaje y la complejidad específica de la aplicación. La evaluación empírica muestra que los métodos existentes tienen dificultades para resolver muchos de los entornos, lo que indica brechas sustanciales en los enfoques actuales para el razonamiento físico. Adicionalmente, incluimos experimentos de real-a-sim-a-real en un manipulador móvil para evaluar la correspondencia entre la simulación y la interacción física en el mundo real. KinDER es completamente de código abierto y tiene como objetivo permitir la comparación sistemática entre diversos paradigmas para avanzar en el razonamiento físico en robótica. Sitio web y código: https://prpl-group.com/kinder-site/

English

Robotic systems that interact with the physical world must reason about kinematic and dynamic constraints imposed by their own embodiment, their environment, and the task at hand. We introduce KinDER, a benchmark for Kinematic and Dynamic Embodied Reasoning that targets physical reasoning challenges arising in robot learning and planning. KinDER comprises 25 procedurally generated environments, a Gymnasium-compatible Python library with parameterized skills and demonstrations, and a standardized evaluation suite with 13 implemented baselines spanning task and motion planning, imitation learning, reinforcement learning, and foundation-model-based approaches. The environments are designed to isolate five core physical reasoning challenges: basic spatial relations, nonprehensile multi-object manipulation, tool use, combinatorial geometric constraints, and dynamic constraints, disentangled from perception, language understanding, and application-specific complexity. Empirical evaluation shows that existing methods struggle to solve many of the environments, indicating substantial gaps in current approaches to physical reasoning. We additionally include real-to-sim-to-real experiments on a mobile manipulator to assess the correspondence between simulation and real-world physical interaction. KinDER is fully open-sourced and intended to enable systematic comparison across diverse paradigms for advancing physical reasoning in robotics. Website and code: https://prpl-group.com/kinder-site/

KinDER: Un punto de referencia de razonamiento físico para el aprendizaje y la planificación de robots

KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning

Resumen

Support