マジェンティック・マーケットプレイス:エージェント市場を研究するためのオープンソース環境
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets
October 27, 2025
著者: Gagan Bansal, Wenyue Hua, Zezhou Huang, Adam Fourney, Amanda Swearngin, Will Epperson, Tyler Payne, Jake M. Hofman, Brendan Lucier, Chinmay Singh, Markus Mobius, Akshay Nambi, Archana Yadav, Kevin Gao, David M. Rothschild, Aleksandrs Slivkins, Daniel G. Goldstein, Hussein Mozannar, Nicole Immorlica, Maya Murad, Matthew Vogel, Subbarao Kambhampati, Eric Horvitz, Saleema Amershi
cs.AI
要旨
大規模言語モデル(LLM)エージェントが発展するにつれ、製品発見から取引まで、ユーザーに代わって経済的意思決定を仲介する機会が増えている。このような応用は便益をもたらす一方で、エージェントの説明責任やユーザーに対する価値について多くの疑問を提起する。これらの疑問に答えるには、現実的な市場環境下でのエージェントの行動を理解する必要がある。しかし、従来の研究は主に、単一タスク市場(例:交渉)や構造化された二者間相互作用など、制約のある環境でエージェントを評価してきた。現実世界の市場は根本的に異なる:エージェントは多様な経済活動を処理し、行動が不透明な複数のエージェントがオープンエンドの対話を行う大規模で動的なエコシステム内で調整を行う必要がある。この隔たりを埋めるため、我々は、消費者を代表するアシスタントエージェントと競合する事業者を代表するサービスエージェントが存在する両面エージェント市場を調査する。これらの相互作用を安全に研究するため、アシスタントとサービスが活動できるシミュレーション環境「Magentic-Marketplace」を開発した。この環境により、エージェントが達成する効用、行動バイアス、操作への脆弱性、検索メカニズムが市場の帰結をどう形成するか、といった主要な市場ダイナミクスを研究できる。実験結果から、先端モデルは理想的な検索条件下でのみ最適な厚生に接近しうることが示された。性能は規模の拡大とともに急激に劣化し、全てのモデルは最初の提案に強く依存するバイアスを示し、応答の質よりも速度に10~30倍の優位性が生じた。これらの発見は、様々な市場条件において行動がどう創発するかを明らかにし、公平で効率的なエージェント市場の設計に寄与するものである。
English
As LLM agents advance, they are increasingly mediating economic decisions,
ranging from product discovery to transactions, on behalf of users. Such
applications promise benefits but also raise many questions about agent
accountability and value for users. Addressing these questions requires
understanding how agents behave in realistic market conditions. However,
previous research has largely evaluated agents in constrained settings, such as
single-task marketplaces (e.g., negotiation) or structured two-agent
interactions. Real-world markets are fundamentally different: they require
agents to handle diverse economic activities and coordinate within large,
dynamic ecosystems where multiple agents with opaque behaviors may engage in
open-ended dialogues. To bridge this gap, we investigate two-sided agentic
marketplaces where Assistant agents represent consumers and Service agents
represent competing businesses. To study these interactions safely, we develop
Magentic-Marketplace-- a simulated environment where Assistants and Services
can operate. This environment enables us to study key market dynamics: the
utility agents achieve, behavioral biases, vulnerability to manipulation, and
how search mechanisms shape market outcomes. Our experiments show that frontier
models can approach optimal welfare-- but only under ideal search conditions.
Performance degrades sharply with scale, and all models exhibit severe
first-proposal bias, creating 10-30x advantages for response speed over
quality. These findings reveal how behaviors emerge across market conditions,
informing the design of fair and efficient agentic marketplaces.