KinDER: Een Benchmark voor Fysiek Redeneren voor Robotleren en Planning

Samenvatting

Robotische systemen die interageren met de fysieke wereld moeten redeneren over kinematische en dynamische beperkingen opgelegd door hun eigen belichaming, hun omgeving en de taak die voorligt. Wij introduceren KinDER, een benchmark voor Kinematisch en Dynamisch Belichaamd Redeneren die zich richt op fysieke redeneeruitdagingen die ontstaan bij robotleren en -planning. KinDER omvat 25 procedureel gegenereerde omgevingen, een Gymnasium-compatibele Python-bibliotheek met geparametriseerde vaardigheden en demonstraties, en een gestandaardiseerde evaluatiesuite met 13 geïmplementeerde basislijnen die taak- en bewegingsplanning, imitatieleren, reinforcement learning en op foundation-modellen gebaseerde benaderingen omvatten. De omgevingen zijn ontworpen om vijf kernuitdagingen voor fysiek redeneren te isoleren: basis ruimtelijke relaties, niet-grijpbare multi-objectmanipulatie, gereedschapsgebruik, combinatorische geometrische beperkingen en dynamische beperkingen, losgekoppeld van perceptie, taalbegrip en toepassingsspecifieke complexiteit. Empirische evaluatie toont aan dat bestaande methoden moeite hebben met het oplossen van veel van de omgevingen, wat duidt op aanzienlijke hiaten in huidige benaderingen van fysiek redeneren. Wij voegen ook real-to-sim-to-real experimenten toe op een mobiele manipulator om de correspondentie tussen simulatie en fysieke interactie in de echte wereld te beoordelen. KinDER is volledig open-source en bedoeld om systematische vergelijking tussen diverse paradigma's mogelijk te maken voor de vooruitgang van fysiek redeneren in de robotica. Website en code: https://prpl-group.com/kinder-site/

English

Robotic systems that interact with the physical world must reason about kinematic and dynamic constraints imposed by their own embodiment, their environment, and the task at hand. We introduce KinDER, a benchmark for Kinematic and Dynamic Embodied Reasoning that targets physical reasoning challenges arising in robot learning and planning. KinDER comprises 25 procedurally generated environments, a Gymnasium-compatible Python library with parameterized skills and demonstrations, and a standardized evaluation suite with 13 implemented baselines spanning task and motion planning, imitation learning, reinforcement learning, and foundation-model-based approaches. The environments are designed to isolate five core physical reasoning challenges: basic spatial relations, nonprehensile multi-object manipulation, tool use, combinatorial geometric constraints, and dynamic constraints, disentangled from perception, language understanding, and application-specific complexity. Empirical evaluation shows that existing methods struggle to solve many of the environments, indicating substantial gaps in current approaches to physical reasoning. We additionally include real-to-sim-to-real experiments on a mobile manipulator to assess the correspondence between simulation and real-world physical interaction. KinDER is fully open-sourced and intended to enable systematic comparison across diverse paradigms for advancing physical reasoning in robotics. Website and code: https://prpl-group.com/kinder-site/

KinDER: Een Benchmark voor Fysiek Redeneren voor Robotleren en Planning

KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning

Samenvatting

Support