Openpi Comet: Solución Competitiva para el Desafío BEHAVIOR 2025
Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge
December 10, 2025
Autores: Junjie Bai, Yu-Wei Chao, Qizhi Chen, Jinwei Gu, Moo Jin Kim, Zhaoshuo Li, Xuan Li, Tsung-Yi Lin, Ming-Yu Liu, Nic Ma, Kaichun Mo, Delin Qu, Shangkun Sun, Hongchi Xia, Fangyin Wei, Xiaohui Zeng
cs.AI
Resumen
El Reto BEHAVIOR 2025 está diseñado para realizar un seguimiento riguroso del progreso hacia la resolución de tareas de horizonte largo por parte de agentes físicos en entornos simulados. BEHAVIOR-1K se centra en tareas domésticas cotidianas con las que las personas desean mayormente que los robots colaboren, y estas tareas presentan desafíos de manipulación móvil de horizonte largo en entornos realistas, cerrando la brecha entre la investigación actual y las aplicaciones reales centradas en el ser humano. Este informe presenta nuestra solución para el Reto BEHAVIOR 2025, la cual obtuvo un muy cercano segundo lugar y supera sustancialmente al resto de las propuestas presentadas. Partiendo de π_{0.5}, nos centramos en construir sistemáticamente nuestra solución estudiando los efectos de las técnicas de entrenamiento y los datos. Mediante ablaciones cuidadosas, demostramos el poder de escalamiento en las fases de pre-entrenamiento y post-entrenamiento para lograr un rendimiento competitivo. Resumimos nuestras lecciones prácticas y recomendaciones de diseño, con la esperanza de que ofrezcan información accionable para la comunidad más amplia de IA incorporada al adaptar modelos base potentes a escenarios incorporados complejos.
English
The 2025 BEHAVIOR Challenge is designed to rigorously track progress toward solving long-horizon tasks by physical agents in simulated environments. BEHAVIOR-1K focuses on everyday household tasks that people most want robots to assist with and these tasks introduce long-horizon mobile manipulation challenges in realistic settings, bridging the gap between current research and real-world, human-centric applications. This report presents our solution to the 2025 BEHAVIOR Challenge in a very close 2nd place and substantially outperforms the rest of the submissions. Building on π_{0.5}, we focus on systematically building our solution by studying the effects of training techniques and data. Through careful ablations, we show the scaling power in pre-training and post-training phases for competitive performance. We summarize our practical lessons and design recommendations that we hope will provide actionable insights for the broader embodied AI community when adapting powerful foundation models to complex embodied scenarios.