静的サンドボックスは不十分である:社会的複雑性のモデリングには、LLMベースのマルチエージェントシミュレーションにおけるオープンエンドな共進化が必要
Static Sandboxes Are Inadequate: Modeling Societal Complexity Requires Open-Ended Co-Evolution in LLM-Based Multi-Agent Simulations
October 15, 2025
著者: Jinkun Chen, Sher Badshah, Xuemin Yu, Sijia Han
cs.AI
要旨
人工エージェントが単にコミュニケーションを取るだけでなく、進化し、適応し、私たちが完全には予測できない方法で世界を再構築できるとしたらどうだろうか?LLM(大規模言語モデル)がマルチエージェントシステムや社会シミュレーションを駆動する中、私たちは終わりなく変化し続ける環境をモデル化する新たな可能性を目の当たりにしている。しかし、現在のほとんどのシミュレーションは、事前に定義されたタスク、限定的なダイナミクス、そして硬直した評価基準によって特徴づけられる静的なサンドボックス内に制約されている。これらの制約は、現実世界の社会の複雑さを捉えることを妨げている。本論文では、静的でタスク特化型のベンチマークが根本的に不十分であり、再考されるべきであると主張する。LLMとマルチエージェントダイナミクスを融合させる新興アーキテクチャを批判的に検討し、安定性と多様性のバランス、予期せぬ行動の評価、そしてより複雑なスケールへの拡張といった主要な課題を指摘し、この急速に進化する分野のための新たな分類体系を紹介する。最後に、オープンエンド性、継続的な共進化、そしてレジリエントで社会的に整合性のあるAIエコシステムの開発を中心とした研究ロードマップを提示する。私たちは、コミュニティに対して静的なパラダイムを超え、次世代の適応的で社会的に意識されたマルチエージェントシミュレーションの形成に貢献するよう呼びかける。
English
What if artificial agents could not just communicate, but also evolve, adapt,
and reshape their worlds in ways we cannot fully predict? With llm now powering
multi-agent systems and social simulations, we are witnessing new possibilities
for modeling open-ended, ever-changing environments. Yet, most current
simulations remain constrained within static sandboxes, characterized by
predefined tasks, limited dynamics, and rigid evaluation criteria. These
limitations prevent them from capturing the complexity of real-world societies.
In this paper, we argue that static, task-specific benchmarks are fundamentally
inadequate and must be rethought. We critically review emerging architectures
that blend llm with multi-agent dynamics, highlight key hurdles such as
balancing stability and diversity, evaluating unexpected behaviors, and scaling
to greater complexity, and introduce a fresh taxonomy for this rapidly evolving
field. Finally, we present a research roadmap centered on open-endedness,
continuous co-evolution, and the development of resilient, socially aligned AI
ecosystems. We call on the community to move beyond static paradigms and help
shape the next generation of adaptive, socially-aware multi-agent simulations.