GLEAM: Aprendizado de Política de Exploração Generalizável para Mapeamento Ativo em Cenas Internas Complexas 3D
GLEAM: Learning Generalizable Exploration Policy for Active Mapping in Complex 3D Indoor Scenes
May 26, 2025
Autores: Xiao Chen, Tai Wang, Quanyi Li, Tao Huang, Jiangmiao Pang, Tianfan Xue
cs.AI
Resumo
O mapeamento ativo generalizável em ambientes complexos e desconhecidos continua sendo um desafio crítico para robôs móveis. Os métodos existentes, limitados por dados de treinamento insuficientes e estratégias de exploração conservadoras, apresentam generalização limitada em cenas com layouts diversos e conectividade complexa. Para permitir treinamento escalável e avaliação confiável, introduzimos o GLEAM-Bench, o primeiro benchmark em grande escala projetado para mapeamento ativo generalizável, com 1.152 cenas 3D diversas de conjuntos de dados sintéticos e de varredura real. Com base nessa fundação, propomos o GLEAM, uma política de exploração generalizável unificada para mapeamento ativo. Sua superior generalização deriva principalmente de nossas representações semânticas, objetivos navegáveis de longo prazo e estratégias randomizadas. Ele supera significativamente os métodos state-of-the-art, alcançando 66,50% de cobertura (+9,49%) com trajetórias eficientes e precisão de mapeamento aprimorada em 128 cenas complexas não vistas. Página do projeto: https://xiao-chen.tech/gleam/.
English
Generalizable active mapping in complex unknown environments remains a
critical challenge for mobile robots. Existing methods, constrained by
insufficient training data and conservative exploration strategies, exhibit
limited generalizability across scenes with diverse layouts and complex
connectivity. To enable scalable training and reliable evaluation, we introduce
GLEAM-Bench, the first large-scale benchmark designed for generalizable active
mapping with 1,152 diverse 3D scenes from synthetic and real-scan datasets.
Building upon this foundation, we propose GLEAM, a unified generalizable
exploration policy for active mapping. Its superior generalizability comes
mainly from our semantic representations, long-term navigable goals, and
randomized strategies. It significantly outperforms state-of-the-art methods,
achieving 66.50% coverage (+9.49%) with efficient trajectories and improved
mapping accuracy on 128 unseen complex scenes. Project page:
https://xiao-chen.tech/gleam/.