CAMAR : Routage Multi-Agent à Actions Continues

papers.abstract

L'apprentissage par renforcement multi-agent (MARL) est un paradigme puissant pour résoudre des problèmes de prise de décision coopératifs et compétitifs. Bien que de nombreux benchmarks MARL aient été proposés, peu combinent des espaces d'états et d'actions continus avec des tâches complexes de coordination et de planification. Nous présentons CAMAR, un nouveau benchmark MARL conçu explicitement pour la recherche de chemin multi-agent dans des environnements à actions continues. CAMAR prend en charge les interactions coopératives et compétitives entre agents et fonctionne efficacement jusqu'à 100 000 étapes d'environnement par seconde. Nous proposons également un protocole d'évaluation à trois niveaux pour mieux suivre les progrès algorithmiques et permettre une analyse approfondie des performances. De plus, CAMAR permet l'intégration de méthodes de planification classiques telles que RRT et RRT* dans les pipelines MARL. Nous les utilisons comme bases de référence autonomes et combinons RRT* avec des algorithmes MARL populaires pour créer des approches hybrides. Nous fournissons une suite de scénarios de test et d'outils de benchmarking pour garantir la reproductibilité et une comparaison équitable. Les expériences montrent que CAMAR constitue un banc d'essai à la fois stimulant et réaliste pour la communauté MARL.

English

Multi-agent reinforcement learning (MARL) is a powerful paradigm for solving cooperative and competitive decision-making problems. While many MARL benchmarks have been proposed, few combine continuous state and action spaces with challenging coordination and planning tasks. We introduce CAMAR, a new MARL benchmark designed explicitly for multi-agent pathfinding in environments with continuous actions. CAMAR supports cooperative and competitive interactions between agents and runs efficiently at up to 100,000 environment steps per second. We also propose a three-tier evaluation protocol to better track algorithmic progress and enable deeper analysis of performance. In addition, CAMAR allows the integration of classical planning methods such as RRT and RRT* into MARL pipelines. We use them as standalone baselines and combine RRT* with popular MARL algorithms to create hybrid approaches. We provide a suite of test scenarios and benchmarking tools to ensure reproducibility and fair comparison. Experiments show that CAMAR presents a challenging and realistic testbed for the MARL community.

CAMAR : Routage Multi-Agent à Actions Continues

CAMAR: Continuous Actions Multi-Agent Routing

papers.abstract

Support