ChatPaper.aiChatPaper

FARE: Быстро-медленное агентное исследование роботов

FARE: Fast-Slow Agentic Robotic Exploration

January 21, 2026
Авторы: Shuhao Liao, Xuxin Lv, Jeric Lew, Shizhe Zhang, Jingsong Liang, Peizhuo Li, Yuhong Cao, Wenjun Wu, Guillaume Sartoretti
cs.AI

Аннотация

Данная работа развивает автономное исследование роботами за счет интеграции семантического планирования на уровне агента с быстрым локальным управлением. Мы представляем FARE — иерархическую систему автономного исследования, которая объединяет большую языковую модель (БЯМ) для глобального планирования и политику обучения с подкреплением (ОП) для локального принятия решений. FARE следует парадигме быстрого и медленного мышления. Медленный модуль БЯМ интерпретирует краткое текстовое описание неизвестной среды и синтезирует стратегию исследования на уровне агента, которая затем преобразуется в последовательность глобальных целевых точек через топологический граф. Для повышения эффективности планирования этот модуль использует механизм pruning на основе модульности, который сокращает избыточные структуры графа. Быстрый модуль ОП выполняет исследование, реагируя на локальные наблюдения, следуя при этом глобальным целевым точкам, сгенерированным БЯМ. Политика ОП дополнительно формируется термином вознаграждения, поощряющим следование глобальным точкам, что обеспечивает согласованное и устойчивое поведение в замкнутом контуре. Данная архитектура разделяет семантическое планирование и геометрические решения, позволяя каждому модулю работать в соответствующем временном и пространственном масштабе. В сложных симулированных средах наши результаты показывают, что FARE достигает значительного повышения эффективности исследования по сравнению с передовыми базовыми методами. Мы также развернули FARE на реальном оборудовании и проверили ее работу в сложной крупномасштабной среде здания размером 200 м × 130 м.
English
This work advances autonomous robot exploration by integrating agent-level semantic reasoning with fast local control. We introduce FARE, a hierarchical autonomous exploration framework that integrates a large language model (LLM) for global reasoning with a reinforcement learning (RL) policy for local decision making. FARE follows a fast-slow thinking paradigm. The slow-thinking LLM module interprets a concise textual description of the unknown environment and synthesizes an agent-level exploration strategy, which is then grounded into a sequence of global waypoints through a topological graph. To further improve reasoning efficiency, this module employs a modularity-based pruning mechanism that reduces redundant graph structures. The fast-thinking RL module executes exploration by reacting to local observations while being guided by the LLM-generated global waypoints. The RL policy is additionally shaped by a reward term that encourages adherence to the global waypoints, enabling coherent and robust closed-loop behavior. This architecture decouples semantic reasoning from geometric decision, allowing each module to operate in its appropriate temporal and spatial scale. In challenging simulated environments, our results show that FARE achieves substantial improvements in exploration efficiency over state-of-the-art baselines. We further deploy FARE on hardware and validate it in complex, large scale 200mtimes130m building environment.
PDF40January 23, 2026