AgentConductor : Évolution topologique pour la génération de code compétitif multi-agent

Résumé

Les systèmes multi-agents (SMA) pilotés par des modèles de langage de grande taille (LLM) coordonnent des agents spécialisés via des topologies d'interaction prédéfinies et ont montré des résultats prometteurs pour des tâches complexes telles que la génération de code de niveau compétition. Des études récentes démontrent que des workflows multi-agents et des graphes de communication soigneusement conçus peuvent significativement améliorer les performances en génération de code en exploitant le raisonnement collaboratif. Cependant, les méthodes existantes n'adaptent ni la densité topologique à la difficulté de la tâche, ni n'affinent itérativement la topologie au sein d'une instance en utilisant les retours d'exécution, ce qui entraîne une communication redondante et des goulots d'étranglement de performance. Pour résoudre ces problèmes, nous proposons AgentConductor : un SMA optimisé par apprentissage par renforcement ayant pour cœur un agent orchestrateur basé sur un LLM, qui permet la génération dynamique de topologies d'interaction pilotée par des retours de bout en bout. Pour chaque requête, AgentConductor infère les rôles des agents et la difficulté de la tâche, puis construit une topologie en graphe acyclique orienté (DAG) stratifié, adaptée à la tâche et sensible à la densité, soutenue par deux innovations clés. Premièrement, nous concevons une nouvelle fonction de densité topologique qui capture des caractérisations mathématiques conscientes de la communication pour les interactions multi-agents. Deuxièmement, nous adoptons un partitionnement par intervalles de difficulté pour éviter un élagage excessif, permettant une mesure précise de la borne supérieure de densité topologique par niveau de difficulté et un contrôle plus fin. Empiriquement, sur trois ensembles de données de code de niveau compétition et deux ensembles de données fondamentaux, AgentConductor atteint une précision de pointe, surpassant la base de référence la plus forte jusqu'à 14,6 % en précision pass@1, 13 % en réduction de densité et 68 % en réduction du coût en tokens.

English

Large language model(LLM)-driven multi-agent systems(MAS) coordinate specialized agents through predefined interaction topologies and have shown promise for complex tasks such as competition-level code generation. Recent studies demonstrate that carefully designed multi-agent workflows and communication graphs can significantly improve code generation performance by leveraging collaborative reasoning. However, existing methods neither adapt topology density to task difficulty nor iteratively refine the topology within an instance using execution feedback, which leads to redundant communication and performance bottlenecks. To address these issues, we propose AgentConductor: a reinforcement learning-optimized MAS with an LLM-based orchestrator agent as its core, which enables end-to-end feedback-driven dynamic generation of interaction topologies. For each query, AgentConductor infers agent roles and task difficulty, then constructs a task-adapted, density-aware layered directed acyclic graph (DAG) topology, underpinned by two key innovations. First, we design a novel topological density function that captures communication-aware mathematical characterizations of multi-agent interactions. Second, we adopt difficulty interval partitioning to avoid excessive pruning for precise topological density upper bound measurement per difficulty level and finer-grained control. Empirically, across three competition-level and two foundational code datasets, AgentConductor achieves state-of-the-art accuracy, outperforming the strongest baseline by up to 14.6% in pass@1 accuracy, 13% in density reduction, and 68% in token cost reduction.

AgentConductor : Évolution topologique pour la génération de code compétitif multi-agent

AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation

Résumé

Support