EVOCHAMBER: Co-evolución en tiempo de prueba de sistemas multi-agente a escalas individual, de equipo y poblacional

Resumen

Sostenemos que la evolución en tiempo de prueba multiagente no es la evolución de un solo agente replicada N veces. Un aprendiz monoagente solo puede evolucionar su propio contexto y memoria. Un sistema multiagente evoluciona adicionalmente quién colabora, cómo colabora y cómo fluye el conocimiento a través de la población. Estos componentes no tienen un equivalente monoagente y pueden generar fenómenos como la especialización emergente. Sin embargo, los métodos anteriores en tiempo de prueba o bien confinan las experiencias a agentes individuales, perdiendo el aprendizaje entre agentes, o bien las transmiten simétricamente a todos los agentes, eliminando la especialización que hace valiosa la colaboración. Presentamos EVOCHAMBER, un marco sin entrenamiento que implementa evolución en tiempo de prueba en tres niveles sobre un conjunto de agentes en coevolución. En su núcleo se encuentra CODREAM (Sueño Colaborativo), un protocolo posterior a la tarea que se activa ante fallos o desacuerdos del equipo, en el cual los agentes reflexionan colaborativamente, destilan conocimientos y los dirigen asimétricamente desde agentes fuertes a débiles en el nicho fallido, preservando la especialización mientras se llenan vacíos de conocimiento. Los operadores a nivel de equipo ensamblan equipos condicionados al nicho y seleccionan estructuras de colaboración en línea. Los operadores de ciclo de vida a nivel de población bifurcan, fusionan, podan y siembran agentes bajo presión de rendimiento. En tres flujos de tareas heterogéneas con Qwen3-8B, EVOCHAMBER alcanza un 63.9% en matemáticas competitivas, un 75.7% en código y un 87.1% en razonamiento multidominio, superando la mejor línea base en un 32% relativo en matemáticas y confirmando la transferencia asimétrica entre agentes como el principal impulsor en la ablación. Partiendo de varios agentes inicializados de forma idéntica, emergen espontáneamente de cuatro a cinco especialistas estables en nichos, una firma estructural de la evolución multiagente que ningún aprendiz monoagente puede expresar. Consulte nuestro código en: https://github.com/Mercury7353/EvoChamber

English

We argue that multi-agent test-time evolution is not single-agent evolution replicated N times. A single-agent learner can only evolve its own context and memory. A multi-agent system additionally evolves who collaborates, how they collaborate, and how knowledge flows across the population. These components have no single-agent counterpart and can produce phenomena such as emergent specialization. Yet prior test-time methods either confine experiences to individual agents, forfeiting cross-agent learning, or broadcast symmetrically to all agents, erasing the specialization that makes collaboration valuable. We present EVOCHAMBER, a training-free framework that instantiates test-time evolution at three levels over a coevolving agent pool. At its core is CODREAM (Collaborative Dreaming), a post-task protocol triggered on team failure or disagreement, in which agents collaboratively reflect, distill insights, and route them asymmetrically from strong to weak agents on the failed niche, preserving specialization while filling knowledge gaps. Team-level operators assemble niche-conditioned teams and select collaboration structures online. Population-level lifecycle operators fork, merge, prune, and seed agents under performance pressure. On three heterogeneous task streams with Qwen3-8B, EVOCHAMBER reaches 63.9% on competition math, 75.7% on code, and 87.1% on multi-domain reasoning, outperforming the best baseline by 32% relative on math and confirming asymmetric cross-agent transfer as the primary driver in ablation. Starting from several identically initialized agents, four to five stable niche specialists spontaneously emerge, a structural signature of multi-agent evolution that no single-agent learner can express. See our code at: https://github.com/Mercury7353/EvoChamber

EVOCHAMBER: Co-evolución en tiempo de prueba de sistemas multi-agente a escalas individual, de equipo y poblacional

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

Resumen

Support