MobileVLA-R1: 모바일 로봇을 위한 시각-언어-행동 강화
MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots
November 22, 2025
저자: Ting Huang, Dongjian Li, Rui Yang, Zeyu Zhang, Zida Yang, Hao Tang
cs.AI
초록
사족 보행 로봇의 자연어 명령을 연속 제어로 접지하는 것은 시각-언어-행동 분야의 근본적인 과제로 남아 있습니다. 기존 방법론은 고차원 의미론적 추론과 저수준 구동 사이의 간극을 메우는 데 어려움을 겪어, 불안정한 접지와 현실 세계에서의 약한 일반화 성능을 초래합니다. 이러한 문제를 해결하기 위해, 우리는 사족 보행 로봇을 위한 명시적 추론과 연속 제어가 가능한 통합 시각-언어-행동 프레임워크인 MobileVLA-R1을 제안합니다. 우리는 구현형 궤적에 대한 다중 세분성 사고의 연속(CoT) 대규모 데이터셋인 MobileVLA-CoT를 구축하여 정렬을 위한 구조화된 추론 감독을 제공합니다. 이를 기반으로 지도 CoT 정렬과 GRPO 강화 학습을 결합한 2단계 학습 패러다임을 도입하여 추론 일관성, 제어 안정성, 그리고 장기간 실행 성능을 향상시킵니다. VLN 및 VLA 과제에 대한 폭넓은 평가에서 강력한 기준선 대비 약 5% 향상된 우수한 성능을 입증했습니다. 사족 보행 로봇에서의 실제 환경 배포는 복잡한 상황에서도 견고한 성능을 검증합니다. 코드: https://github.com/AIGeeksGroup/MobileVLA-R1. 웹사이트: https://aigeeksgroup.github.io/MobileVLA-R1.
English
Grounding natural-language instructions into continuous control for quadruped robots remains a fundamental challenge in vision language action. Existing methods struggle to bridge high-level semantic reasoning and low-level actuation, leading to unstable grounding and weak generalization in the real world. To address these issues, we present MobileVLA-R1, a unified vision-language-action framework that enables explicit reasoning and continuous control for quadruped robots. We construct MobileVLA-CoT, a large-scale dataset of multi-granularity chain-of-thought (CoT) for embodied trajectories, providing structured reasoning supervision for alignment. Built upon this foundation, we introduce a two-stage training paradigm that combines supervised CoT alignment with GRPO reinforcement learning to enhance reasoning consistency, control stability, and long-horizon execution. Extensive evaluations on VLN and VLA tasks demonstrate superior performance over strong baselines, with approximately a 5% improvement. Real-world deployment on a quadruped robot validates robust performance in complex environments. Code: https://github.com/AIGeeksGroup/MobileVLA-R1. Website: https://aigeeksgroup.github.io/MobileVLA-R1.