CAMAR: Roteamento Multiagente com Ações Contínuas

Resumo

O aprendizado por reforço multiagente (MARL) é um paradigma poderoso para resolver problemas de tomada de decisão cooperativos e competitivos. Embora muitos benchmarks de MARL tenham sido propostos, poucos combinam espaços contínuos de estados e ações com tarefas desafiadoras de coordenação e planejamento. Apresentamos o CAMAR, um novo benchmark de MARL projetado explicitamente para busca de caminhos multiagente em ambientes com ações contínuas. O CAMAR suporta interações cooperativas e competitivas entre agentes e é executado de forma eficiente, atingindo até 100.000 passos de ambiente por segundo. Também propomos um protocolo de avaliação de três níveis para acompanhar melhor o progresso algorítmico e permitir uma análise mais profunda do desempenho. Além disso, o CAMAR permite a integração de métodos clássicos de planejamento, como RRT e RRT*, em pipelines de MARL. Utilizamos esses métodos como baselines independentes e combinamos o RRT* com algoritmos populares de MARL para criar abordagens híbridas. Fornecemos um conjunto de cenários de teste e ferramentas de benchmarking para garantir reprodutibilidade e comparação justa. Experimentos mostram que o CAMAR representa um ambiente de teste desafiador e realista para a comunidade de MARL.

English

Multi-agent reinforcement learning (MARL) is a powerful paradigm for solving cooperative and competitive decision-making problems. While many MARL benchmarks have been proposed, few combine continuous state and action spaces with challenging coordination and planning tasks. We introduce CAMAR, a new MARL benchmark designed explicitly for multi-agent pathfinding in environments with continuous actions. CAMAR supports cooperative and competitive interactions between agents and runs efficiently at up to 100,000 environment steps per second. We also propose a three-tier evaluation protocol to better track algorithmic progress and enable deeper analysis of performance. In addition, CAMAR allows the integration of classical planning methods such as RRT and RRT* into MARL pipelines. We use them as standalone baselines and combine RRT* with popular MARL algorithms to create hybrid approaches. We provide a suite of test scenarios and benchmarking tools to ensure reproducibility and fair comparison. Experiments show that CAMAR presents a challenging and realistic testbed for the MARL community.

CAMAR: Roteamento Multiagente com Ações Contínuas

CAMAR: Continuous Actions Multi-Agent Routing

Resumo

Support