ChatPaper.aiChatPaper

AgenticPay: 구매자-판매자 거래를 위한 다중 에이전트 LLM 협상 시스템

AgenticPay: A Multi-Agent LLM Negotiation System for Buyer-Seller Transactions

February 5, 2026
저자: Xianyang Liu, Shangding Gu, Dawn Song
cs.AI

초록

대규모 언어 모델(LLM) 기반 에이전트가 자율적으로 협상, 조정 및 거래를 수행할 것이라는 기대가 커지고 있지만, 기존 벤치마크는 다중 에이전트 간 언어 기반 경제적 상호작용을 평가하기 위한 체계적인 환경을 제공하지 못했습니다. 본 연구는 자연어로驱动的되는 다중 에이전트 구매자-판매자 협상을 위한 벤치마크 및 시뮬레이션 프레임워크인 AgenticPay를 소개합니다. AgenticPay는 구매자와 판매자가 각각 비공개 제약 조건과 제품 의존적 가치 평가를 보유하고, 숫자 입찰만이 아닌 다중 라운드 언어적 협상을 통해 합의에 도달해야 하는 시장을 모델링합니다. 본 프레임워크는 양자 간 협상에서 다대다 시장에 이르기까지 110개 이상의 다양한 작업을 지원하며, 구조화된 행동 추출 및 실행 가능성, 효율성, 후생을 측정하는 지표를 포함합니다. 최첨단 독점 및 오픈 웨이트 LLM에 대한 벤치마킹 결과, 협상 성능에서 상당한 격차가 나타났으며 장기 전략적 추론에서의 과제를 부각시켜, AgenticPay가 에이전트 기반 상거래 및 언어 기반 시장 상호작용 연구를 위한 기초를 마련함을 입증했습니다. 코드와 데이터셋은 다음 링크에서 이용 가능합니다: https://github.com/SafeRL-Lab/AgenticPay.
English
Large language model (LLM)-based agents are increasingly expected to negotiate, coordinate, and transact autonomously, yet existing benchmarks lack principled settings for evaluating language-mediated economic interaction among multiple agents. We introduce AgenticPay, a benchmark and simulation framework for multi-agent buyer-seller negotiation driven by natural language. AgenticPay models markets in which buyers and sellers possess private constraints and product-dependent valuations, and must reach agreements through multi-round linguistic negotiation rather than numeric bidding alone. The framework supports a diverse suite of over 110 tasks ranging from bilateral bargaining to many-to-many markets, with structured action extraction and metrics for feasibility, efficiency, and welfare. Benchmarking state-of-the-art proprietary and open-weight LLMs reveals substantial gaps in negotiation performance and highlights challenges in long-horizon strategic reasoning, establishing AgenticPay as a foundation for studying agentic commerce and language-based market interaction. Code and dataset are available at the link: https://github.com/SafeRL-Lab/AgenticPay.
PDF41February 13, 2026