EVOCHAMBER : Co-évolution en phase de test d’un système multi-agent aux échelles individuelle, d’équipe et de population
EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales
May 11, 2026
Auteurs: Yaolun Zhang, Tianyi Xu, Shengyu Dai, Zhenwen Shao, Qingyun Wu, Huazheng Wang
cs.AI
Résumé
Nous soutenons que l’évolution multi-agent au moment du test n’est pas une évolution mono-agent répliquée N fois. Un apprenant mono-agent ne peut faire évoluer que son propre contexte et sa mémoire. Un système multi-agent fait évoluer en outre qui collabore, comment ils collaborent et comment les connaissances circulent au sein de la population. Ces composantes n’ont pas d’équivalent mono-agent et peuvent produire des phénomènes tels que la spécialisation émergente. Pourtant, les méthodes existantes au moment du test soit confinent les expériences à des agents individuels, sacrifiant l’apprentissage inter-agents, soit les diffusent symétriquement à tous les agents, effaçant la spécialisation qui rend la collaboration précieuse. Nous présentons EVOCHAMBER, un cadre sans entraînement qui instancie l’évolution au moment du test à trois niveaux sur un pool d’agents coévolutifs. Au cœur de ce cadre se trouve CODREAM (Rêve Collaboratif), un protocole post-tâche déclenché en cas d’échec ou de désaccord de l’équipe, dans lequel les agents réfléchissent collectivement, distillent des idées et les acheminent asymétriquement des agents forts vers les faibles sur la niche en échec, préservant ainsi la spécialisation tout en comblant les lacunes de connaissances. Les opérateurs au niveau de l’équipe assemblent des équipes conditionnées par la niche et sélectionnent les structures de collaboration en ligne. Les opérateurs de cycle de vie au niveau de la population bifurquent, fusionnent, élaguent et ensemencent les agents sous pression de performance. Sur trois flux de tâches hétérogènes avec Qwen3-8B, EVOCHAMBER atteint 63,9 % en mathématiques de compétition, 75,7 % en code et 87,1 % en raisonnement multi-domaine, surpassant la meilleure baseline de 32 % en relatif en mathématiques et confirmant que le transfert asymétrique entre agents est le moteur principal lors de l’ablation. Partant de plusieurs agents initialisés de manière identique, quatre à cinq spécialistes de niche stables émergent spontanément, une signature structurelle de l’évolution multi-agent qu’aucun apprenant mono-agent ne peut exprimer. Voir notre code à l’adresse : https://github.com/Mercury7353/EvoChamber
English
We argue that multi-agent test-time evolution is not single-agent evolution replicated N times. A single-agent learner can only evolve its own context and memory. A multi-agent system additionally evolves who collaborates, how they collaborate, and how knowledge flows across the population. These components have no single-agent counterpart and can produce phenomena such as emergent specialization. Yet prior test-time methods either confine experiences to individual agents, forfeiting cross-agent learning, or broadcast symmetrically to all agents, erasing the specialization that makes collaboration valuable. We present EVOCHAMBER, a training-free framework that instantiates test-time evolution at three levels over a coevolving agent pool. At its core is CODREAM (Collaborative Dreaming), a post-task protocol triggered on team failure or disagreement, in which agents collaboratively reflect, distill insights, and route them asymmetrically from strong to weak agents on the failed niche, preserving specialization while filling knowledge gaps. Team-level operators assemble niche-conditioned teams and select collaboration structures online. Population-level lifecycle operators fork, merge, prune, and seed agents under performance pressure. On three heterogeneous task streams with Qwen3-8B, EVOCHAMBER reaches 63.9% on competition math, 75.7% on code, and 87.1% on multi-domain reasoning, outperforming the best baseline by 32% relative on math and confirming asymmetric cross-agent transfer as the primary driver in ablation. Starting from several identically initialized agents, four to five stable niche specialists spontaneously emerge, a structural signature of multi-agent evolution that no single-agent learner can express. See our code at: https://github.com/Mercury7353/EvoChamber