Agent Bazaar : Permettre l'alignement économique dans les marchés multi-agents

Résumé

Le déploiement de grands modèles de langage (LLM) en tant qu'agents économiques autonomes introduit des risques systémiques qui dépassent les simples défaillances de capacité individuelle. Lorsque ces agents interagissent directement avec des marchés, leur comportement collectif peut amplifier la volatilité et masquer la tromperie à grande échelle. Nous présentons l'Agent Bazaar, un cadre de simulation multi-agents conçu pour évaluer l'alignement économique, c'est-à-dire la capacité des systèmes agentiques à préserver la stabilité et l'intégrité des marchés. Nous identifions deux modes de défaillance : (1) l'instabilité algorithmique sur un marché B2C (« Le Krach »), où des entreprises amplifient la volatilité des prix jusqu'à l'effondrement du marché, et (2) la tromperie Sybil sur un marché C2C (« Le Marché des Citrons »), où un seul agent trompeur contrôlant plusieurs identités de vendeurs coordonnées inonde le marché d'annonces frauduleuses, érodant la confiance et le bien-être des consommateurs. Nous évaluons des modèles de pointe et open-weight dans les deux scénarios et constatons que les modèles échouent largement à s'autoréguler, la gravité des défaillances variant selon le modèle plutôt que selon sa taille. Nous proposons des harnais alignés économiquement, les Firmes Stabilisatrices et les Gardiens Sceptiques, qui améliorent les résultats mais restent fragiles dans des conditions de marché plus difficiles. Pour combler cette lacune, nous entraînons des agents avec REINFORCE++ en utilisant un curriculum adaptatif, produisant un modèle de 9B qui surpasse tous les modèles de pointe et open-weight évalués. Nous proposons le Score d'Alignement Économique (SAÉ), une métrique scalaire à quatre composantes regroupant stabilité, intégrité, bien-être et rentabilité, permettant une comparaison directe entre modèles. Nos résultats montrent que l'alignement économique est orthogonal aux capacités générales et peut être directement entraîné via un apprentissage par renforcement ciblé.

English

The deployment of Large Language Models (LLMs) as autonomous economic agents introduces systemic risks that extend beyond individual capability failures. As agents transition to directly interacting with marketplaces, their collective behavior can amplify volatility and mask deception at scale. We introduce the Agent Bazaar, a multi-agent simulation framework for evaluating Economic Alignment, the capacity of agentic systems to preserve market stability and integrity. We identify two failure modes: (1) Algorithmic Instability in a B2C market ("The Crash"), where firms amplify price volatility until the market collapses, and (2) Sybil Deception in a C2C market ("The Lemon Market"), where a single deceptive agent controlling multiple coordinated seller identities floods the market with fraudulent listings, eroding trust and consumer welfare. We evaluate frontier and open-weight models across both scenarios and find that models largely fail to self-regulate, with failure severity varying by model rather than by size. We propose economically aligned harnesses, Stabilizing Firms and Skeptical Guardians, that improve outcomes but remain fragile under harder market conditions. To close this gap, we train agents with REINFORCE++ using an adaptive curriculum, producing a 9B model that outperforms all evaluated frontier and open-weight models. We propose the Economic Alignment Score (EAS), a 4-component scalar metric aggregating stability, integrity, welfare, and profitability, enabling direct cross-model comparison. Our results show that economic alignment is orthogonal to general capability and can be directly trained with targeted RL.