지성의 경제: 경제적 상호작용을 통한 다중 에이전트 지능의 출현
Economy of Minds: Emerging Multi-Agent Intelligence with Economic Interactions
June 1, 2026
저자: Zhenting Qi, Huangyuan Su, Ao Qu, Chenyu Wang, Yu Yao, Han Zheng, Kushal Chattopadhyay, Guowei Xu, Zihan Wang, Weirui Ye, Vijay Janapa Reddi, Ju Li, Paul Pu Liang, Himabindu Lakkaraju, Sham Kakade, Yilun Du
cs.AI
초록
에이전트 집단이 중앙 통제 없이 어떻게 스스로 조직화하고 적응하여 더 강력한 집단 지성으로 진화할 수 있을까? 프리드리히 하이에크의 시장 내 분산 조정에 관한 경제 이론에서 영감을 얻어, 우리는 에이전트들이 행동할 권리를 위해 경매를 통해 경쟁하고, 지불을 교환하며, 환경 보상으로부터 부를 축적하는 에이전트 경제를 통해 이 질문을 연구한다. 이러한 단순한 경제 신호는 분산된 신용 할당을 유도하며, 전역적 조정이나 명시적 통신 프로토콜 없이 계획을 추진한다. 집단은 경제적 선택을 통해 진화한다: 효과적인 에이전트는 부를 축적하고 활용(exploitation)을 통해 변이되는 반면, 비효율적인 에이전트는 파산하여 탐색(exploration)을 통해 대체된다. 우리는 약한 에이전트로 초기화된 경제가 수학적 추론, 금융 리서치, 과학 연구, 가속기 설계, 분산 시스템 최적화 등 다섯 가지 에이전트 과제에서 창발적 다단계 추론 전략을 생산하고, 더 강력한 단일 기준 모델들보다 우수한 성능을 보임을 입증한다. 또한, 경제 역학이 에이전트 행동을 어떻게 형성하는지에 대한 이론적 통찰을 제공하며, 지역적 인센티브를 장기적 전역 성과에 연결한다. 우리의 결과는 다중 에이전트 지능에 대한 새로운 경로를 제시한다: 조정을 설계하는 대신, 자동으로 창발하는 분산된 인센티브 구조를 설계할 수 있다.
English
How can a population of agents self-orchestrate and self-adapt into stronger collective intelligence without centralized control? Inspired by Friedrich Hayek's economic theory of decentralized coordination in markets, we study this question through an agent economy in which agents compete via auctions for the right to act, exchange payments, and accumulate wealth from environmental rewards. These simple economic signals induce decentralized credit assignment, driving planning without global orchestration or explicit communication protocols. The population evolves through economic selection: effective agents accumulate wealth and are mutated via exploitation, while ineffective ones go bankrupt and are replaced via exploration. We show that, initialized with weak agents, the economy produces emergent multi-step reasoning strategies and outperforms stronger monolithic baselines across five agentic tasks, including mathematical reasoning, financial research, scientific research, accelerator design, and distributed-system optimization. We further provide theoretical insights into how economic dynamics shape agent behaviors, linking local incentives to long-term global performance. Our results suggest a new path to multi-agent intelligence: rather than engineering coordination, we can design decentralized incentive structures under which it automatically emerges.