SIM1: 変形可能な世界におけるゼロショットデータスケーラーとしての物理整合シミュレータ
SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds
April 9, 2026
著者: Yunsong Zhou, Hangxu Liu, Xuekun Jiang, Xing Shen, Yuanzhen Zhou, Hui Wang, Baole Fang, Yang Tian, Mulin Yu, Qiaojun Yu, Li Ma, Hengjie Li, Hanqing Wang, Jia Zeng, Jiangmiao Pang
cs.AI
要旨
変形可能物体を対象としたロボットマニピュレーションは、具体化学習においてデータ集約的な領域であり、形状・接触・トポロジーが連動して変化する様相は剛体の変動性をはるかに超える。シミュレーションは実世界データ収集のコスト軽減を約束するものの、既存のsim-to-realパイプラインは依然として剛体の抽象化に依存しており、不適切な形状表現、脆弱な軟体力学、布インタラクションに不向きな運動プリミティブを生成する。我々は、シミュレーションの課題が「合成的であること」ではなく「実世界に根ざしていないこと」にあると考える。この問題に対処するため、物理世界に基盤を置く物理整合型real-to-sim-to-realデータエンジンSIM1を提案する。本システムは限定的な実演データを基に、場景をメトリック整合性のあるデジタルツインとして再構築し、弾性モデリングによる変形力学の較正、拡散ベース軌道生成と品質フィルタリングによる行動多様化を実現する。このパイプラインは疎な観測を、実演に迫る忠実度を持つ拡張合成教師信号へ変換する。実験では、純合成データで訓練したポリシーが実データベースラインと1:15の等価比で同等の性能を達成し、実世界展開において90%のゼロショット成功率と50%の一般化性能向上を示した。これらの結果は、物理整合型シミュレーションが変形物体マニピュレーションの拡張可能な教師信号として有効であり、データ効率的なポリシー学習の現実的経路であることを実証する。
English
Robotic manipulation with deformable objects represents a data-intensive regime in embodied learning, where shape, contact, and topology co-evolve in ways that far exceed the variability of rigids. Although simulation promises relief from the cost of real-world data acquisition, prevailing sim-to-real pipelines remain rooted in rigid-body abstractions, producing mismatched geometry, fragile soft dynamics, and motion primitives poorly suited for cloth interaction. We posit that simulation fails not for being synthetic, but for being ungrounded. To address this, we introduce SIM1, a physics-aligned real-to-sim-to-real data engine that grounds simulation in the physical world. Given limited demonstrations, the system digitizes scenes into metric-consistent twins, calibrates deformable dynamics through elastic modeling, and expands behaviors via diffusion-based trajectory generation with quality filtering. This pipeline transforms sparse observations into scaled synthetic supervision with near-demonstration fidelity. Experiments show that policies trained on purely synthetic data achieve parity with real-data baselines at a 1:15 equivalence ratio, while delivering 90% zero-shot success and 50% generalization gains in real-world deployment. These results validate physics-aligned simulation as scalable supervision for deformable manipulation and a practical pathway for data-efficient policy learning.