EVOCHAMBER: Совместная эволюция мультиагентной системы на этапе тестирования на уровнях индивида, команды и популяции

Аннотация

Мы утверждаем, что мультиагентная эволюция в тестовое время — это не одоагентная эволюция, повторенная N раз. Одиночный агент-обучаемый может эволюционировать только свой собственный контекст и память. Мультиагентная система дополнительно эволюционирует: кто сотрудничает, как они сотрудничают и как знания распространяются в популяции. У этих компонентов нет аналога для одиночного агента, и они могут порождать такие явления, как эмерджентная специализация. Тем не менее, существующие методы тестового времени либо ограничивают опыт отдельными агентами, теряя меж-агентное обучение, либо транслируют его симметрично всем агентам, стирая специализацию, которая делает сотрудничество ценным. Мы представляем EVOCHAMBER — фреймворк без обучения, который реализует эволюцию в тестовое время на трёх уровнях над совместно эволюционирующим пулом агентов. Его ядром является CODREAM (Collaborative Dreaming) — пост-задачный протокол, запускаемый при неудаче команды или разногласиях, в котором агенты совместно рефлексируют, извлекают инсайты и асимметрично направляют их от сильных агентов к слабым в неудавшейся нише, сохраняя специализацию и заполняя пробелы в знаниях. Операторы на уровне команды собирают команды, обусловленные нишей, и выбирают структуры сотрудничества онлайн. Операторы жизненного цикла на уровне популяции форкают, сливают, сокращают и порождают агентов под давлением производительности. На трёх гетерогенных потоках задач с Qwen3-8B EVOCHAMBER достигает 63.9% на конкурсной математике, 75.7% на коде и 87.1% на многопредметном рассуждении, превосходя лучший базовый метод на 32% по относительному показателю на математике и подтверждая асимметричную передачу между агентами как основной движущий фактор в абляции. Начиная с нескольких одинаково инициализированных агентов, спонтанно возникают четыре-пять стабильных нишевых специалистов — структурный признак мультиагентной эволюции, который не может проявить ни один одиночный агент-обучаемый. См. наш код по адресу: https://github.com/Mercury7353/EvoChamber

English

We argue that multi-agent test-time evolution is not single-agent evolution replicated N times. A single-agent learner can only evolve its own context and memory. A multi-agent system additionally evolves who collaborates, how they collaborate, and how knowledge flows across the population. These components have no single-agent counterpart and can produce phenomena such as emergent specialization. Yet prior test-time methods either confine experiences to individual agents, forfeiting cross-agent learning, or broadcast symmetrically to all agents, erasing the specialization that makes collaboration valuable. We present EVOCHAMBER, a training-free framework that instantiates test-time evolution at three levels over a coevolving agent pool. At its core is CODREAM (Collaborative Dreaming), a post-task protocol triggered on team failure or disagreement, in which agents collaboratively reflect, distill insights, and route them asymmetrically from strong to weak agents on the failed niche, preserving specialization while filling knowledge gaps. Team-level operators assemble niche-conditioned teams and select collaboration structures online. Population-level lifecycle operators fork, merge, prune, and seed agents under performance pressure. On three heterogeneous task streams with Qwen3-8B, EVOCHAMBER reaches 63.9% on competition math, 75.7% on code, and 87.1% on multi-domain reasoning, outperforming the best baseline by 32% relative on math and confirming asymmetric cross-agent transfer as the primary driver in ablation. Starting from several identically initialized agents, four to five stable niche specialists spontaneously emerge, a structural signature of multi-agent evolution that no single-agent learner can express. See our code at: https://github.com/Mercury7353/EvoChamber

EVOCHAMBER: Совместная эволюция мультиагентной системы на этапе тестирования на уровнях индивида, команды и популяции

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

Аннотация

Support