TacoMAS: LLM 기반 다중 에이전트 시스템에서의 테스트 시점 토폴로지 및 능력 공진화
TacoMAS: Test-Time Co-Evolution of Topology and Capability in LLM-based Multi-Agent Systems
May 10, 2026
저자: Chen Xu, Yicheng Hu, Ruizi Wang, Xinyu Lin, Wenjie Wang, Dongrui Liu, Fuli Feng
cs.AI
초록
다중 에이전트 시스템(MAS)은 복잡한 과제를 해결하기 위한 유망한 패러다임으로 부상했다. 최근 연구에서는 에이전트의 능력이나 통신 토폴로지를 자동으로 최적화하는 자기 진화형 MAS를 탐구해 왔다. 그러나 기존 방법들은 추론 시점에 고정된 토폴로지를 학습하거나, 추론 중에 토폴로지나 능력 중 하나만 적응시킨다. 우리는 경험적 및 이론적으로 효과적인 테스트 시점 진화를 위해서는 두 축을 공동으로 적응시켜야 하지만, 서로 다른 시간 척도로 이루어져야 함을 보여준다: 능력은 새로 등장하는 하위 과제를 처리하기 위해 빠르게 업데이트되어야 하는 반면, 토폴로지는 협력 안정성을 유지하기 위해 더 느리게 진화해야 한다. 그런 다음 우리는 동적 MAS를 위한 테스트 시점 공진화 프레임워크인 TacoMAS를 소개한다. TacoMAS는 MAS 추론을 온라인 그래프 적응 과제로 정식화하며, 여기서 노드는 역할별 능력을 가진 에이전트를 나타내고 엣지는 그들의 통신 토폴로지를 정의한다. 추론 중에 빠른 능력 루프는 궤적 수준의 피드백을 사용하여 에이전트 전문성을 업데이트하고, 느린 메타-LLM 기반 토폴로지 루프는 엣지 편집, 에이전트 추가 및 에이전트 제거를 포함한 에이전트의 생성-소멸 연산을 MAS에서 수행한다. 우리는 추가로 이 빠름-느림 설계가 MAS 진화를 과제 조건화된 안정 평형으로 이끈다는 것을 보여준다. 네 개의 벤치마크에 대한 실험은 TacoMAS가 거의 20개의 다중 에이전트 기준선보다 우수하며, 가장 강력한 기준선 대비 평균 13.3%의 성능 향상을 달성함을 입증한다. 코드는 https://github.com/chenxu2-gif/TacoMAS-MultiAgent에서 공개되었다.
English
Multi-agent systems (MAS) have emerged as a promising paradigm for solving complex tasks. Recent work has explored self-evolving MAS that automatically optimize agent capabilities or communication topologies. However, existing methods either learn a topology that remains fixed at inference time or adapt only the topology or capability during inference. We empirically and theoretically show that effective test-time evolution requires jointly adapting both axes, but on different time scales: capabilities should update rapidly to handle emerging subtasks, while the topology should evolve more slowly to preserve coordination stability. We then introduce TacoMAS, a test-time co-evolution framework for dynamic MAS. TacoMAS formulates MAS inference as a task of online graph adaptation, where nodes represent agents with role-specific capabilities and edges define their communication topology. During inference, a fast capability loop updates agent expertise using trajectory-level feedback, while a slow meta-LLM-driven topology loop performs agents' birth-death operations on MAS, including edge edit, agent addition, and agent removal. We further show that this fast-slow design drives MAS evolution toward a task-conditioned stable equilibrium. Experiments on four benchmarks demonstrate that TacoMAS outperforms nearly 20 multi-agent baselines, achieving an average improvement of 13.3% over the strongest baseline. The codes are released at https://github.com/chenxu2-gif/TacoMAS-MultiAgent.