AgenticPay: Een Multi-Agent LLM-onderhandelingssysteem voor koper-verkoper transacties

Samenvatting

Op grote taalmodellen (LLM's) gebaseerde agents worden in toenemende mate verwacht autonoom te onderhandelen, te coördineren en transacties uit te voeren, maar bestaande benchmarks missen principiële settings om taalgedreven economische interactie tussen meerdere agents te evalueren. Wij introduceren AgenticPay, een benchmark- en simulatiekader voor onderhandelingen tussen kopers en verkopers met meerdere agents, aangedreven door natuurlijke taal. AgenticPay modelleert markten waarin kopers en verkopers private restricties en productafhankelijke waarderingen hebben, en overeenkomsten moeten bereiken via meerronde linguïstische onderhandeling in plaats van uitsluitend numerieke biedingen. Het kader ondersteunt een diverse reeks van meer dan 110 taken, variërend van bilaterale onderhandelingen tot many-to-many markten, met gestructureerde actie-extractie en metrieken voor haalbaarheid, efficiëntie en welvaart. Het benchmarken van state-of-the-art propriëtaire en open-weight LLM's onthult aanzienlijke hiaten in onderhandelingsprestaties en benadrukt uitdagingen in strategisch redeneren over lange tijdshorizonnen, waarmee AgenticPay zich vestigt als een fundament voor de studie van agent-gedreven handel en op taal gebaseerde marktinteractie. Code en dataset zijn beschikbaar via de link: https://github.com/SafeRL-Lab/AgenticPay.

English

Large language model (LLM)-based agents are increasingly expected to negotiate, coordinate, and transact autonomously, yet existing benchmarks lack principled settings for evaluating language-mediated economic interaction among multiple agents. We introduce AgenticPay, a benchmark and simulation framework for multi-agent buyer-seller negotiation driven by natural language. AgenticPay models markets in which buyers and sellers possess private constraints and product-dependent valuations, and must reach agreements through multi-round linguistic negotiation rather than numeric bidding alone. The framework supports a diverse suite of over 110 tasks ranging from bilateral bargaining to many-to-many markets, with structured action extraction and metrics for feasibility, efficiency, and welfare. Benchmarking state-of-the-art proprietary and open-weight LLMs reveals substantial gaps in negotiation performance and highlights challenges in long-horizon strategic reasoning, establishing AgenticPay as a foundation for studying agentic commerce and language-based market interaction. Code and dataset are available at the link: https://github.com/SafeRL-Lab/AgenticPay.

AgenticPay: Een Multi-Agent LLM-onderhandelingssysteem voor koper-verkoper transacties

AgenticPay: A Multi-Agent LLM Negotiation System for Buyer-Seller Transactions

Samenvatting

Support