정적 샌드박스는 부적합하다: 사회적 복잡성 모델링을 위해서는 LLM 기반 다중 에이전트 시뮬레이션에서의 개방형 공진화가 필요하다
Static Sandboxes Are Inadequate: Modeling Societal Complexity Requires Open-Ended Co-Evolution in LLM-Based Multi-Agent Simulations
October 15, 2025
저자: Jinkun Chen, Sher Badshah, Xuemin Yu, Sijia Han
cs.AI
초록
인공 에이전트가 단순히 의사소통하는 것을 넘어 진화하고 적응하며, 우리가 완전히 예측할 수 없는 방식으로 그들의 세계를 재구성할 수 있다면 어떨까? LLM(대형 언어 모델)이 다중 에이전트 시스템과 사회 시뮬레이션을 구동함에 따라, 우리는 끝없이 변화하는 환경을 모델링할 수 있는 새로운 가능성을 목격하고 있다. 그러나 현재 대부분의 시뮬레이션은 사전 정의된 작업, 제한된 역학, 그리고 경직된 평가 기준으로 특징지어지는 정적 샌드박스 내에 갇혀 있다. 이러한 한계는 실제 사회의 복잡성을 포착하는 것을 방해한다. 본 논문에서 우리는 정적이고 작업 중심의 벤치마크가 근본적으로 부적합하며 재고되어야 한다고 주장한다. 우리는 LLM과 다중 에이전트 역학을 결합한 신흥 아키텍처를 비판적으로 검토하고, 안정성과 다양성의 균형, 예상치 못한 행동의 평가, 더 큰 복잡성으로의 확장과 같은 주요 장애물을 강조하며, 이 빠르게 진화하는 분야를 위한 새로운 분류 체계를 소개한다. 마지막으로, 우리는 개방성, 지속적인 공진화, 그리고 회복력 있고 사회적으로 조화된 AI 생태계의 개발에 초점을 맞춘 연구 로드맵을 제시한다. 우리는 커뮤니티가 정적 패러다임을 넘어 적응적이고 사회적으로 인식된 다중 에이전트 시뮬레이션의 다음 세대를 형성하는 데 도움을 줄 것을 촉구한다.
English
What if artificial agents could not just communicate, but also evolve, adapt,
and reshape their worlds in ways we cannot fully predict? With llm now powering
multi-agent systems and social simulations, we are witnessing new possibilities
for modeling open-ended, ever-changing environments. Yet, most current
simulations remain constrained within static sandboxes, characterized by
predefined tasks, limited dynamics, and rigid evaluation criteria. These
limitations prevent them from capturing the complexity of real-world societies.
In this paper, we argue that static, task-specific benchmarks are fundamentally
inadequate and must be rethought. We critically review emerging architectures
that blend llm with multi-agent dynamics, highlight key hurdles such as
balancing stability and diversity, evaluating unexpected behaviors, and scaling
to greater complexity, and introduce a fresh taxonomy for this rapidly evolving
field. Finally, we present a research roadmap centered on open-endedness,
continuous co-evolution, and the development of resilient, socially aligned AI
ecosystems. We call on the community to move beyond static paradigms and help
shape the next generation of adaptive, socially-aware multi-agent simulations.