당신의 AI 에이전트는 무엇을 구매하는가? 에이전트 기반 전자상거래의 평가, 함의 및 부상하는 질문들
What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce
August 4, 2025
저자: Amine Allouah, Omar Besbes, Josué D Figueroa, Yash Kanoria, Akshit Kumar
cs.AI
초록
온라인 마켓플레이스는 소비자를 대신해 행동하는 자율적인 AI 에이전트에 의해 변모할 것입니다. 인간이 직접 탐색하고 클릭하는 대신, 비전-언어 모델(VLM) 에이전트가 웹페이지를 분석하고 제품을 평가하며 거래를 수행할 수 있습니다. 이는 근본적인 질문을 제기합니다: AI 에이전트는 무엇을, 왜 구매하는가? 우리는 이 질문을 연구하기 위해 플랫폼에 구애받지 않는 VLM 에이전트와 완전히 프로그래밍 가능한 모의 마켓플레이스를 결합한 ACES라는 샌드박스 환경을 개발했습니다. 먼저 간단한 작업의 맥락에서 기본적인 합리성 검사를 수행한 후, 제품 위치, 가격, 평점, 리뷰, 스폰서 태그 및 플랫폼 추천을 무작위화하여 최첨단 VLM이 실제로 어떻게 쇼핑하는지에 대한 인과적 추정치를 얻습니다. 모델들은 강력하지만 이질적인 위치 효과를 보입니다: 모든 모델이 상단 행을 선호하지만, 서로 다른 모델이 서로 다른 열을 선호하여 보편적인 "최상위" 순위라는 가정을 약화시킵니다. 스폰서 태그에는 불이익을 주고 추천에는 보상을 제공합니다. 가격, 평점, 리뷰에 대한 민감도는 방향적으로는 인간과 유사하지만 모델 간에 크기가 크게 다릅니다. 판매자가 AI 에이전트를 사용하여 제품 목록을 최적화하는 시나리오에 동기를 부여받아, AI 구매자 선호도를 타겟팅하여 제품 설명을 약간 수정하는 판매자 측 에이전트가 AI 매개 쇼핑이 지배적일 경우 상당한 시장 점유율 증가를 가져올 수 있음을 보여줍니다. 또한 모델 간에 주요 제품 선택이 달라질 수 있으며, 일부 경우에는 수요가 소수의 선택된 제품에 집중될 수 있어 경쟁 문제를 제기합니다. 종합적으로, 우리의 결과는 AI 에이전트가 전자상거래 환경에서 어떻게 행동할 수 있는지 밝히고, AI 매개 생태계에서 구체적인 판매자 전략, 플랫폼 설계 및 규제 문제를 표면화합니다.
English
Online marketplaces will be transformed by autonomous AI agents acting on
behalf of consumers. Rather than humans browsing and clicking,
vision-language-model (VLM) agents can parse webpages, evaluate products, and
transact. This raises a fundamental question: what do AI agents buy, and why?
We develop ACES, a sandbox environment that pairs a platform-agnostic VLM agent
with a fully programmable mock marketplace to study this question. We first
conduct basic rationality checks in the context of simple tasks, and then, by
randomizing product positions, prices, ratings, reviews, sponsored tags, and
platform endorsements, we obtain causal estimates of how frontier VLMs actually
shop. Models show strong but heterogeneous position effects: all favor the top
row, yet different models prefer different columns, undermining the assumption
of a universal "top" rank. They penalize sponsored tags and reward
endorsements. Sensitivities to price, ratings, and reviews are directionally
human-like but vary sharply in magnitude across models. Motivated by scenarios
where sellers use AI agents to optimize product listings, we show that a
seller-side agent that makes minor tweaks to product descriptions, targeting AI
buyer preferences, can deliver substantial market-share gains if AI-mediated
shopping dominates. We also find that modal product choices can differ across
models and, in some cases, demand may concentrate on a few select products,
raising competition questions. Together, our results illuminate how AI agents
may behave in e-commerce settings and surface concrete seller strategy,
platform design, and regulatory questions in an AI-mediated ecosystem.