ChatPaper.aiChatPaper

ABot-N0: 다재다능한 구현형 내비게이션을 위한 VLA 파운데이션 모델 기술 보고서

ABot-N0: Technical Report on the VLA Foundation Model for Versatile Embodied Navigation

February 12, 2026
저자: Zedong Chu, Shichao Xie, Xiaolong Wu, Yanfen Shen, Minghua Luo, Zhengbo Wang, Fei Liu, Xiaoxu Leng, Junjun Hu, Mingyang Yin, Jia Lu, Yingnan Guo, Kai Yang, Jiawei Han, Xu Chen, Yanqing Zhu, Yuxiang Zhao, Xin Liu, Yirong Yang, Ye He, Jiahang Wang, Yang Cai, Tianlin Zhang, Li Gao, Liu Liu, Mingchao Sun, Fan Jiang, Chiyu Wang, Zhicheng Liu, Hongyu Pan, Honglin Han, Zhining Gu, Kuan Yang, Jianfang Zhang, Di Jing, Zihao Guan, Wei Guo, Guoqing Liu, Di Yang, Xiangpo Yang, Menglin Yang, Hongguang Xing, Weiguo Li, Mu Xu
cs.AI

초록

구현체 내비게이션은 오랫동안 작업별 특화 아키텍처로 분절되어 왔습니다. 우리는 Point-Goal, Object-Goal, Instruction-Following, POI-Goal, Person-Following 등 5가지 핵심 작업 전반에 걸쳐 '대통합(Grand Unification)'을 달성하는 통합 Vision-Language-Action(VLA) 파운데이션 모델 ABot-N0를 소개합니다. ABot-N0는 계층적 'Brain-Action' 아키텍처를 활용하여, 의미론적 추론을 위한 LLM 기반 인지 뇌(Cognitive Brain)와 정밀하고 연속적인 궤적 생성을 위한 Flow Matching 기반 행동 전문가(Action Expert)를 결합합니다. 대규모 학습을 지원하기 위해 우리는 7,802개의 고품질 3D 장면(10.7 km²)에 걸쳐 1,690만 개의 전문가 궤적과 500만 개의 추론 샘플을 정제한 ABot-N0 데이터 엔진을 개발했습니다. ABot-N0는 7개 벤치마크에서 새로운 SOTA 성능을 달성하여 특화 모델들을 크게 능가합니다. 나아가, 우리의 에이전트 내비게이션 시스템은 플래너와 계층적 위상 기억(Topological Memory)을 통합하여 동적인 실제 환경에서 강건한 장기 임무 수행을 가능하게 합니다.
English
Embodied navigation has long been fragmented by task-specific architectures. We introduce ABot-N0, a unified Vision-Language-Action (VLA) foundation model that achieves a ``Grand Unification'' across 5 core tasks: Point-Goal, Object-Goal, Instruction-Following, POI-Goal, and Person-Following. ABot-N0 utilizes a hierarchical ``Brain-Action'' architecture, pairing an LLM-based Cognitive Brain for semantic reasoning with a Flow Matching-based Action Expert for precise, continuous trajectory generation. To support large-scale learning, we developed the ABot-N0 Data Engine, curating 16.9M expert trajectories and 5.0M reasoning samples across 7,802 high-fidelity 3D scenes (10.7 km^2). ABot-N0 achieves new SOTA performance across 7 benchmarks, significantly outperforming specialized models. Furthermore, our Agentic Navigation System integrates a planner with hierarchical topological memory, enabling robust, long-horizon missions in dynamic real-world environments.
PDF20February 14, 2026