Магнитная торговая площадка: среда с открытым исходным кодом для исследования агентных рынков
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets
October 27, 2025
Авторы: Gagan Bansal, Wenyue Hua, Zezhou Huang, Adam Fourney, Amanda Swearngin, Will Epperson, Tyler Payne, Jake M. Hofman, Brendan Lucier, Chinmay Singh, Markus Mobius, Akshay Nambi, Archana Yadav, Kevin Gao, David M. Rothschild, Aleksandrs Slivkins, Daniel G. Goldstein, Hussein Mozannar, Nicole Immorlica, Maya Murad, Matthew Vogel, Subbarao Kambhampati, Eric Horvitz, Saleema Amershi
cs.AI
Аннотация
По мере развития агентных систем на основе больших языковых моделей (LLM) они все чаще опосредуют экономические решения — от поиска продуктов до совершения транзакций — от имени пользователей. Такие приложения сулят выгоды, но также порождают множество вопросов относительно подотчетности агентов и их ценности для пользователей. Для решения этих вопросов необходимо понимать, как агенты ведут себя в условиях, приближенных к реальным рыночным. Однако предыдущие исследования в основном оценивали агентов в ограниченных сценариях, таких как рынки для решения единичных задач (например, переговоры) или структурированные взаимодействия между двумя агентами. Реальные рынки фундаментально отличаются: они требуют от агентов способности справляться с разнообразными экономическими активностями и координироваться в рамках крупных, динамичных экосистем, где множество агентов с непрозрачным поведением могут вести открытые диалоги. Чтобы преодолеть этот разрыв, мы исследуем двусторонние агентные рынки, где Ассистенты представляют интересы потребителей, а Сервисные агенты — конкурирующие бизнесы. Для безопасного изучения этих взаимодействий мы разработали Magentic-Marketplace — симулированную среду, в которой могут функционировать Ассистенты и Сервисы. Эта среда позволяет нам изучать ключевые рыночные динамики: полезность, достигаемую агентами, поведенческие смещения, уязвимость к манипуляциям и то, как механизмы поиска влияют на рыночные результаты. Наши эксперименты показывают, что передовые модели могут приближаться к оптимальной эффективности — но только в идеальных условиях поиска. Производительность резко ухудшается с ростом масштаба, и все модели демонстрируют сильное смещение в пользу первого предложения, создавая 10-30-кратное преимущество скорости ответа над его качеством. Эти результаты раскрывают, как поведение агентов формируется в различных рыночных условиях, что информирует проектирование справедливых и эффективных агентных рынков.
English
As LLM agents advance, they are increasingly mediating economic decisions,
ranging from product discovery to transactions, on behalf of users. Such
applications promise benefits but also raise many questions about agent
accountability and value for users. Addressing these questions requires
understanding how agents behave in realistic market conditions. However,
previous research has largely evaluated agents in constrained settings, such as
single-task marketplaces (e.g., negotiation) or structured two-agent
interactions. Real-world markets are fundamentally different: they require
agents to handle diverse economic activities and coordinate within large,
dynamic ecosystems where multiple agents with opaque behaviors may engage in
open-ended dialogues. To bridge this gap, we investigate two-sided agentic
marketplaces where Assistant agents represent consumers and Service agents
represent competing businesses. To study these interactions safely, we develop
Magentic-Marketplace-- a simulated environment where Assistants and Services
can operate. This environment enables us to study key market dynamics: the
utility agents achieve, behavioral biases, vulnerability to manipulation, and
how search mechanisms shape market outcomes. Our experiments show that frontier
models can approach optimal welfare-- but only under ideal search conditions.
Performance degrades sharply with scale, and all models exhibit severe
first-proposal bias, creating 10-30x advantages for response speed over
quality. These findings reveal how behaviors emerge across market conditions,
informing the design of fair and efficient agentic marketplaces.