ChatPaper.aiChatPaper

그룹 진화 에이전트: 경험 공유를 통한 개방형 자기 발전

Group-Evolving Agents: Open-Ended Self-Improvement via Experience Sharing

February 4, 2026
저자: Zhaotian Weng, Antonis Antoniades, Deepak Nathani, Zhen Zhang, Xiao Pu, Xin Eric Wang
cs.AI

초록

개방형 자기 개선 에이전트는 사전 정의된 아키텍처의 한계를 극복하고 능력을 발전시키기 위해 자율적으로 자신의 구조적 설계를 수정함으로써 인간의 개입에 대한 의존도를 줄일 수 있습니다. 본 논문에서는 그룹 에이전트를 기본 진화 단위로 삼아 진화 과정 전반에 걸쳐 명시적인 경험 공유와 재사용을 가능하게 하는 새로운 개방형 자기 개선 패러다임인 그룹 진화 에이전트(GEA)를 소개합니다. 기존의 트리 구조 진화 방식을 채택한 개방형 자기 진화 패러다임과 달리, GEA는 고립된 진화 분기로 인한 탐색 다양성의 비효율적 활용 한계를 극복합니다. GEA를 도전적인 코딩 벤치마크에서 평가한 결과, 최첨단 자기 진화 방법을 크게 능가하고(SWE-bench Verified에서 71.0% 대 56.7%, Polyglot에서 88.3% 대 68.3%), 인간이 설계한 최고 수준의 에이전트 프레임워크와 비슷하거나 그 성능을 넘어섰습니다(각각 두 벤치마크에서 71.8% 및 52.0%). 분석 결과, GEA는 초기 탐색 다양성을 지속적인 장기 발전으로 더 효과적으로 전환하여 동일한 수의 진화된 에이전트 하에서 더 강력한 성능을 달성하는 것으로 나타났습니다. 더 나아가 GEA는 서로 다른 코딩 모델 간에 일관된 전이성을 보였으며, 프레임워크 수준 버그를 자기 진화 방법이 5회 소요되는 것에 비해 평균 1.4회 반복만에 수정하는 더 큰 견고성을 나타냈습니다.
English
Open-ended self-improving agents can autonomously modify their own structural designs to advance their capabilities and overcome the limits of pre-defined architectures, thus reducing reliance on human intervention. We introduce Group-Evolving Agents (GEA), a new paradigm for open-ended self-improvements, which treats a group of agents as the fundamental evolutionary unit, enabling explicit experience sharing and reuse within the group throughout evolution. Unlike existing open-ended self-evolving paradigms that adopt tree-structured evolution, GEA overcomes the limitation of inefficient utilization of exploratory diversity caused by isolated evolutionary branches. We evaluate GEA on challenging coding benchmarks, where it significantly outperforms state-of-the-art self-evolving methods (71.0% vs. 56.7% on SWE-bench Verified, 88.3% vs. 68.3% on Polyglot) and matches or exceeds top human-designed agent frameworks (71.8% and 52.0% on two benchmarks, respectively). Analysis reveals that GEA more effectively converts early-stage exploratory diversity into sustained, long-term progress, achieving stronger performance under the same number of evolved agents. Furthermore, GEA exhibits consistent transferability across different coding models and greater robustness, fixing framework-level bugs in 1.4 iterations on average, versus 5 for self-evolving methods.
PDF83March 16, 2026