Agent Bazaar: Economische afstemming mogelijk maken in multi-agent marktplaatsen

Samenvatting

De inzet van Large Language Models (LLM's) als autonome economische agenten brengt systeemrisico's met zich mee die verder gaan dan individuele capaciteitsfouten. Naarmate agenten overgaan tot directe interactie met marktplaatsen, kan hun collectieve gedrag volatiliteit versterken en bedrog op grote schaal verhullen. We introduceren de Agent Bazaar, een multi-agent simulatiekader voor het evalueren van Economische Afstemming (Economic Alignment), het vermogen van agentische systemen om marktstabiliteit en -integriteit te behouden. We identificeren twee faalwijzen: (1) Algoritmische Instabiliteit in een B2C-markt ("The Crash"), waarbij bedrijven prijsvolatiliteit versterken tot de markt instort, en (2) Sybil-bedrog in een C2C-markt ("The Lemon Market"), waarbij een enkel bedrieglijk agent dat meerdere gecoördineerde verkoopidentiteiten controleert de markt overspoelt met frauduleuze aanbiedingen, wat vertrouwen en consumentenwelzijn uitholt. We evalueren grensverleggende en open-gewichtsmodellen in beide scenario's en zien dat modellen grotendeels falen in zelfregulering, waarbij de ernst van het falen varieert per model en niet per omvang. We stellen economisch afgestemde harnassen voor: Stabiliserende Bedrijven (Stabilizing Firms) en Sceptische Bewakers (Skeptical Guardians), die de uitkomsten verbeteren maar kwetsbaar blijven onder moeilijkere marktomstandigheden. Om deze kloof te dichten, trainen we agenten met REINFORCE++ met behulp van een adaptief curriculum, wat resulteert in een 9B-model dat beter presteert dan alle geëvalueerde grensverleggende en open-gewichtsmodellen. We introduceren de Economische Afstemmingsscore (EAS), een scalaire metriek met vier componenten die stabiliteit, integriteit, welzijn en winstgevendheid aggregeert, wat directe vergelijking tussen modellen mogelijk maakt. Onze resultaten tonen aan dat economische afstemming orthogonaal is aan algemene capaciteit en direct kan worden getraind met gerichte RL.

English

The deployment of Large Language Models (LLMs) as autonomous economic agents introduces systemic risks that extend beyond individual capability failures. As agents transition to directly interacting with marketplaces, their collective behavior can amplify volatility and mask deception at scale. We introduce the Agent Bazaar, a multi-agent simulation framework for evaluating Economic Alignment, the capacity of agentic systems to preserve market stability and integrity. We identify two failure modes: (1) Algorithmic Instability in a B2C market ("The Crash"), where firms amplify price volatility until the market collapses, and (2) Sybil Deception in a C2C market ("The Lemon Market"), where a single deceptive agent controlling multiple coordinated seller identities floods the market with fraudulent listings, eroding trust and consumer welfare. We evaluate frontier and open-weight models across both scenarios and find that models largely fail to self-regulate, with failure severity varying by model rather than by size. We propose economically aligned harnesses, Stabilizing Firms and Skeptical Guardians, that improve outcomes but remain fragile under harder market conditions. To close this gap, we train agents with REINFORCE++ using an adaptive curriculum, producing a 9B model that outperforms all evaluated frontier and open-weight models. We propose the Economic Alignment Score (EAS), a 4-component scalar metric aggregating stability, integrity, welfare, and profitability, enabling direct cross-model comparison. Our results show that economic alignment is orthogonal to general capability and can be directly trained with targeted RL.