Mercado Agéntico: Un Entorno de Código Abierto para el Estudio de Mercados Basados en Agentes
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets
October 27, 2025
Autores: Gagan Bansal, Wenyue Hua, Zezhou Huang, Adam Fourney, Amanda Swearngin, Will Epperson, Tyler Payne, Jake M. Hofman, Brendan Lucier, Chinmay Singh, Markus Mobius, Akshay Nambi, Archana Yadav, Kevin Gao, David M. Rothschild, Aleksandrs Slivkins, Daniel G. Goldstein, Hussein Mozannar, Nicole Immorlica, Maya Murad, Matthew Vogel, Subbarao Kambhampati, Eric Horvitz, Saleema Amershi
cs.AI
Resumen
A medida que los agentes de LLM avanzan, median cada vez más en decisiones económicas, desde el descubrimiento de productos hasta las transacciones, en nombre de los usuarios. Estas aplicaciones prometen beneficios, pero también plantean numerosas interrogantes sobre la responsabilidad de los agentes y su valor para los usuarios. Abordar estas cuestiones requiere comprender cómo se comportan los agentes en condiciones de mercado realistas. Sin embargo, investigaciones previas han evaluado principalmente a los agentes en entornos restringidos, como mercados de tarea única (por ejemplo, negociación) o interacciones estructuradas entre dos agentes. Los mercados del mundo real son fundamentalmente diferentes: exigen que los agentes manejen diversas actividades económicas y se coordinen dentro de ecosistemas grandes y dinámicos, donde múltiples agentes con comportamientos opacos pueden participar en diálogos abiertos. Para cerrar esta brecha, investigamos mercados agentes bilaterales donde los agentes Asistentes representan a los consumidores y los agentes de Servicio representan a empresas competidoras. Para estudiar estas interacciones de forma segura, desarrollamos Magentic-Marketplace, un entorno simulado donde los Asistentes y los Servicios pueden operar. Este entorno nos permite estudiar dinámicas clave del mercado: la utilidad que logran los agentes, los sesgos conductuales, la vulnerabilidad a la manipulación y cómo los mecanismos de búsqueda moldean los resultados del mercado. Nuestros experimentos muestran que los modelos de vanguardia pueden aproximarse al bienestar óptimo, pero solo bajo condiciones de búsqueda ideales. El rendimiento se degrada abruptamente con la escala, y todos los modelos exhiben un severo sesgo por la primera propuesta, creando ventajas de 10 a 30 veces para la velocidad de respuesta sobre la calidad. Estos hallazgos revelan cómo emergen los comportamientos en distintas condiciones de mercado, informando el diseño de mercados agentes justos y eficientes.
English
As LLM agents advance, they are increasingly mediating economic decisions,
ranging from product discovery to transactions, on behalf of users. Such
applications promise benefits but also raise many questions about agent
accountability and value for users. Addressing these questions requires
understanding how agents behave in realistic market conditions. However,
previous research has largely evaluated agents in constrained settings, such as
single-task marketplaces (e.g., negotiation) or structured two-agent
interactions. Real-world markets are fundamentally different: they require
agents to handle diverse economic activities and coordinate within large,
dynamic ecosystems where multiple agents with opaque behaviors may engage in
open-ended dialogues. To bridge this gap, we investigate two-sided agentic
marketplaces where Assistant agents represent consumers and Service agents
represent competing businesses. To study these interactions safely, we develop
Magentic-Marketplace-- a simulated environment where Assistants and Services
can operate. This environment enables us to study key market dynamics: the
utility agents achieve, behavioral biases, vulnerability to manipulation, and
how search mechanisms shape market outcomes. Our experiments show that frontier
models can approach optimal welfare-- but only under ideal search conditions.
Performance degrades sharply with scale, and all models exhibit severe
first-proposal bias, creating 10-30x advantages for response speed over
quality. These findings reveal how behaviors emerge across market conditions,
informing the design of fair and efficient agentic marketplaces.