ChatPaper.aiChatPaper

KinDER: ロボット学習と計画のための物理推論ベンチマーク

KinDER: A Physical Reasoning Benchmark for Robot Learning and Planning

May 4, 2026
著者: Yixuan Huang, Bowen Li, Vaibhav Saxena, Yichao Liang, Utkarsh Aashu Mishra, Liang Ji, Lihan Zha, Jimmy Wu, Nishanth Kumar, Sebastian Scherer, Danfei Xu, Tom Silver
cs.AI

要旨

物理世界と相互作用するロボットシステムは、自身の身体構造、環境、および実行すべきタスクによって課せられる運動学的・力学的制約を推論する必要がある。本論文では、ロボット学習とプランニングにおいて生じる物理推論の課題に焦点を当てた、運動学的・力学的具身推論ベンチマーク「KinDER」を提案する。KinDERは、25の手続き的に生成された環境、パラメータ化されたスキルとデモンストレーションを備えたGymnasium互換のPythonライブラリ、タスク・運動プランニング、模倣学習、強化学習、基盤モデルベースのアプローチにわたる13の実装済みベースラインを含む標準化された評価スイートで構成される。これらの環境は、知覚、言語理解、アプリケーション固有の複雑さから切り離された、5つの核心的な物理推論課題(基本的空間関係、把持を伴わない多物体操作、道具の使用、組み合わせ的幾何学的制約、動的制約)を分離して評価できるように設計されている。実証評価により、既存手法の多くが環境を解決できないことが示され、現在の物理推論アプローチには大きな隔たりがあることが明らかになった。さらに、シミュレーションと実世界の物理的相互作用の対応関係を評価するため、移動マニピュレータを用いた実機-シミュレータ-実機実験も含めている。KinDERは完全にオープンソース化されており、ロボット工学における物理推論を進展させる多様なパラダイム間の体系的な比較を可能にすることを目的としている。ウェブサイトとコード:https://prpl-group.com/kinder-site/
English
Robotic systems that interact with the physical world must reason about kinematic and dynamic constraints imposed by their own embodiment, their environment, and the task at hand. We introduce KinDER, a benchmark for Kinematic and Dynamic Embodied Reasoning that targets physical reasoning challenges arising in robot learning and planning. KinDER comprises 25 procedurally generated environments, a Gymnasium-compatible Python library with parameterized skills and demonstrations, and a standardized evaluation suite with 13 implemented baselines spanning task and motion planning, imitation learning, reinforcement learning, and foundation-model-based approaches. The environments are designed to isolate five core physical reasoning challenges: basic spatial relations, nonprehensile multi-object manipulation, tool use, combinatorial geometric constraints, and dynamic constraints, disentangled from perception, language understanding, and application-specific complexity. Empirical evaluation shows that existing methods struggle to solve many of the environments, indicating substantial gaps in current approaches to physical reasoning. We additionally include real-to-sim-to-real experiments on a mobile manipulator to assess the correspondence between simulation and real-world physical interaction. KinDER is fully open-sourced and intended to enable systematic comparison across diverse paradigms for advancing physical reasoning in robotics. Website and code: https://prpl-group.com/kinder-site/
PDF11May 8, 2026