Magentic Marketplace : Un environnement open source pour l'étude des marchés agentiels
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets
October 27, 2025
papers.authors: Gagan Bansal, Wenyue Hua, Zezhou Huang, Adam Fourney, Amanda Swearngin, Will Epperson, Tyler Payne, Jake M. Hofman, Brendan Lucier, Chinmay Singh, Markus Mobius, Akshay Nambi, Archana Yadav, Kevin Gao, David M. Rothschild, Aleksandrs Slivkins, Daniel G. Goldstein, Hussein Mozannar, Nicole Immorlica, Maya Murad, Matthew Vogel, Subbarao Kambhampati, Eric Horvitz, Saleema Amershi
cs.AI
papers.abstract
À mesure que les agents de LLM progressent, ils interviennent de plus en plus dans les décisions économiques, allant de la découverte de produits aux transactions, au nom des utilisateurs. Ces applications promettent des avantages mais soulèvent également de nombreuses questions concernant la responsabilité des agents et leur valeur pour les utilisateurs. Répondre à ces questions nécessite de comprendre comment les agents se comportent dans des conditions de marché réalistes. Cependant, les recherches antérieures ont largement évalué les agents dans des cadres contraints, tels que des places de marché à tâche unique (par exemple, la négociation) ou des interactions structurées entre deux agents. Les marchés réels sont fondamentalement différents : ils exigent que les agents gèrent des activités économiques diverses et se coordonnent au sein de vastes écosystèmes dynamiques où de multiples agents aux comportements opaques peuvent engager des dialogues ouverts. Pour combler cette lacune, nous étudions des places de marché agentielles à double sens où les agents Assistants représentent les consommateurs et les agents Services représentent des entreprises concurrentes. Pour étudier ces interactions en toute sécurité, nous développons Magentic-Marketplace – un environnement simulé où les Assistants et les Services peuvent opérer. Cet environnement nous permet d'étudier les dynamiques de marché clés : l'utilité obtenue par les agents, les biais comportementaux, la vulnérabilité à la manipulation, et comment les mécanismes de recherche façonnent les résultats du marché. Nos expériences montrent que les modèles de pointe peuvent approcher une utilité sociale optimale – mais seulement dans des conditions de recherche idéales. Les performances se dégradent fortement avec l'échelle, et tous les modèles présentent un biais sévère en faveur de la première proposition, créant un avantage de 10 à 30 fois pour la vitesse de réponse par rapport à la qualité. Ces résultats révèlent comment les comportements émergent selon les conditions de marché, éclairant la conception de places de marché agentielles équitables et efficaces.
English
As LLM agents advance, they are increasingly mediating economic decisions,
ranging from product discovery to transactions, on behalf of users. Such
applications promise benefits but also raise many questions about agent
accountability and value for users. Addressing these questions requires
understanding how agents behave in realistic market conditions. However,
previous research has largely evaluated agents in constrained settings, such as
single-task marketplaces (e.g., negotiation) or structured two-agent
interactions. Real-world markets are fundamentally different: they require
agents to handle diverse economic activities and coordinate within large,
dynamic ecosystems where multiple agents with opaque behaviors may engage in
open-ended dialogues. To bridge this gap, we investigate two-sided agentic
marketplaces where Assistant agents represent consumers and Service agents
represent competing businesses. To study these interactions safely, we develop
Magentic-Marketplace-- a simulated environment where Assistants and Services
can operate. This environment enables us to study key market dynamics: the
utility agents achieve, behavioral biases, vulnerability to manipulation, and
how search mechanisms shape market outcomes. Our experiments show that frontier
models can approach optimal welfare-- but only under ideal search conditions.
Performance degrades sharply with scale, and all models exhibit severe
first-proposal bias, creating 10-30x advantages for response speed over
quality. These findings reveal how behaviors emerge across market conditions,
informing the design of fair and efficient agentic marketplaces.