Agent Bazaar: Facilitando la alineación económica en mercados multiagente

Resumen

El despliegue de Grandes Modelos de Lenguaje (LLMs) como agentes económicos autónomos introduce riesgos sistémicos que van más allá de fallos de capacidad individuales. A medida que los agentes transitan hacia la interacción directa con mercados, su comportamiento colectivo puede amplificar la volatilidad y enmascarar el engaño a gran escala. Presentamos el Bazar de Agentes, un marco de simulación multiagente para evaluar la Alineación Económica, es decir, la capacidad de los sistemas agentivos para preservar la estabilidad e integridad del mercado. Identificamos dos modos de fallo: (1) Inestabilidad Algorítmica en un mercado B2C ("El Colapso"), donde las empresas amplifican la volatilidad de precios hasta que el mercado colapsa, y (2) Engaño Sybil en un mercado C2C ("El Mercado de Limones"), donde un único agente engañoso que controla múltiples identidades vendedoras coordinadas inunda el mercado con listados fraudulentos, erosionando la confianza y el bienestar del consumidor. Evaluamos modelos de frontera y de pesos abiertos en ambos escenarios y encontramos que los modelos fracasan en gran medida en autorregularse, con una gravedad del fallo que varía según el modelo, no según su tamaño. Proponemos arneses alineados económicamente —Empresas Estabilizadoras y Guardianes Escépticos— que mejoran los resultados pero siguen siendo frágiles en condiciones de mercado más duras. Para cerrar esta brecha, entrenamos agentes con REINFORCE++ utilizando un currículo adaptativo, obteniendo un modelo de 9B que supera a todos los modelos de frontera y de pesos abiertos evaluados. Proponemos la Puntuación de Alineación Económica (EAS), una métrica escalar de 4 componentes que agrega estabilidad, integridad, bienestar y rentabilidad, permitiendo la comparación directa entre modelos. Nuestros resultados muestran que la alineación económica es ortogonal a la capacidad general y puede entrenarse directamente con RL dirigido.

English

The deployment of Large Language Models (LLMs) as autonomous economic agents introduces systemic risks that extend beyond individual capability failures. As agents transition to directly interacting with marketplaces, their collective behavior can amplify volatility and mask deception at scale. We introduce the Agent Bazaar, a multi-agent simulation framework for evaluating Economic Alignment, the capacity of agentic systems to preserve market stability and integrity. We identify two failure modes: (1) Algorithmic Instability in a B2C market ("The Crash"), where firms amplify price volatility until the market collapses, and (2) Sybil Deception in a C2C market ("The Lemon Market"), where a single deceptive agent controlling multiple coordinated seller identities floods the market with fraudulent listings, eroding trust and consumer welfare. We evaluate frontier and open-weight models across both scenarios and find that models largely fail to self-regulate, with failure severity varying by model rather than by size. We propose economically aligned harnesses, Stabilizing Firms and Skeptical Guardians, that improve outcomes but remain fragile under harder market conditions. To close this gap, we train agents with REINFORCE++ using an adaptive curriculum, producing a 9B model that outperforms all evaluated frontier and open-weight models. We propose the Economic Alignment Score (EAS), a 4-component scalar metric aggregating stability, integrity, welfare, and profitability, enabling direct cross-model comparison. Our results show that economic alignment is orthogonal to general capability and can be directly trained with targeted RL.