ChatPaper.aiChatPaper

Openpi Comet: 2025 BEHAVIOR 챌린지 경쟁 솔루션

Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge

December 10, 2025
저자: Junjie Bai, Yu-Wei Chao, Qizhi Chen, Jinwei Gu, Moo Jin Kim, Zhaoshuo Li, Xuan Li, Tsung-Yi Lin, Ming-Yu Liu, Nic Ma, Kaichun Mo, Delin Qu, Shangkun Sun, Hongchi Xia, Fangyin Wei, Xiaohui Zeng
cs.AI

초록

2025 BEHAVIOR 챌린지는 시뮬레이션 환경에서 물리적 에이전트의 장기적 과제 해결 능력 향상 과정을 엄격하게 추적하기 위해 설계되었습니다. BEHAVIOR-1K는 사람들이 로봇의 지원을 가장 원하는 일상적인 가정 내 작업에 중점을 두며, 이러한 과제들은 현실적인 환경에서 장기적 이동 조작 문제를 제기함으로써 현재 연구와 실제 인간 중심 응용 분야 간의 격차를 해소합니다. 본 보고서는 2025 BEHAVIOR 챌린지에서 아주 근소한 차이로 2위를 기록한 우리의 솔루션을 소개하며, 이는 제출된 다른 솔루션들을 상당히 큰 차이로 능가하는 성능을 보였습니다. π_{0.5}를 기반으로, 우리는 훈련 기법과 데이터의 영향을 체계적으로 연구함으로써 솔루션을 구축하는 데 주력했습니다. 신중한 애블레이션 연구를 통해 경쟁력 있는 성능을 달성하기 위한 사전 훈련 및 사후 훈련 단계의 확장 가능성을 입증합니다. 우리는 강력한 파운데이션 모델을 복잡한 구현 AI 시나리오에 적용할 때 더 넓은 구현 AI 커뮤니티에 실행 가능한 통찰력을 제공할 것으로 기대하는 실용적인 교훈과 설계 권장 사항을 요약합니다.
English
The 2025 BEHAVIOR Challenge is designed to rigorously track progress toward solving long-horizon tasks by physical agents in simulated environments. BEHAVIOR-1K focuses on everyday household tasks that people most want robots to assist with and these tasks introduce long-horizon mobile manipulation challenges in realistic settings, bridging the gap between current research and real-world, human-centric applications. This report presents our solution to the 2025 BEHAVIOR Challenge in a very close 2nd place and substantially outperforms the rest of the submissions. Building on π_{0.5}, we focus on systematically building our solution by studying the effects of training techniques and data. Through careful ablations, we show the scaling power in pre-training and post-training phases for competitive performance. We summarize our practical lessons and design recommendations that we hope will provide actionable insights for the broader embodied AI community when adapting powerful foundation models to complex embodied scenarios.
PDF163December 17, 2025