AgenticPay: Un Sistema de Negociación Multi-Agente Basado en LLM para Transacciones Comprador-Vendedor
AgenticPay: A Multi-Agent LLM Negotiation System for Buyer-Seller Transactions
February 5, 2026
Autores: Xianyang Liu, Shangding Gu, Dawn Song
cs.AI
Resumen
Los agentes basados en modelos de lenguaje grande (LLM) son cada vez más requeridos para negociar, coordinar y realizar transacciones de forma autónoma; sin embargo, los puntos de referencia existentes carecen de entornos fundamentados para evaluar la interacción económica mediada por lenguaje entre múltiples agentes. Presentamos AgenticPay, un punto de referencia y marco de simulación para la negociación multiagente entre compradores y vendedores impulsada por lenguaje natural. AgenticPay modela mercados en los que compradores y vendedores poseen restricciones privadas y valoraciones dependientes del producto, y deben llegar a acuerdos mediante una negociación lingüística en múltiples rondas, no solo mediante ofertas numéricas. El marco admite un conjunto diverso de más de 110 tareas que van desde la negociación bilateral hasta mercados muchos-a-muchos, con extracción estructurada de acciones y métricas de factibilidad, eficiencia y bienestar. La evaluación comparativa de LLM propietarios y de peso abierto de última generación revela brechas sustanciales en el rendimiento de la negociación y resalta los desafíos en el razonamiento estratégico de horizonte largo, estableciendo a AgenticPay como una base para estudiar el comercio agéntico y la interacción de mercados basada en lenguaje. El código y el conjunto de datos están disponibles en el enlace: https://github.com/SafeRL-Lab/AgenticPay.
English
Large language model (LLM)-based agents are increasingly expected to negotiate, coordinate, and transact autonomously, yet existing benchmarks lack principled settings for evaluating language-mediated economic interaction among multiple agents. We introduce AgenticPay, a benchmark and simulation framework for multi-agent buyer-seller negotiation driven by natural language. AgenticPay models markets in which buyers and sellers possess private constraints and product-dependent valuations, and must reach agreements through multi-round linguistic negotiation rather than numeric bidding alone. The framework supports a diverse suite of over 110 tasks ranging from bilateral bargaining to many-to-many markets, with structured action extraction and metrics for feasibility, efficiency, and welfare. Benchmarking state-of-the-art proprietary and open-weight LLMs reveals substantial gaps in negotiation performance and highlights challenges in long-horizon strategic reasoning, establishing AgenticPay as a foundation for studying agentic commerce and language-based market interaction. Code and dataset are available at the link: https://github.com/SafeRL-Lab/AgenticPay.