Wat Koopt Jouw AI-Agent? Evaluatie, Implicaties en Opkomende Vragen voor Agent-Gestuurde E-Commerce
What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce
August 4, 2025
Auteurs: Amine Allouah, Omar Besbes, Josué D Figueroa, Yash Kanoria, Akshit Kumar
cs.AI
Samenvatting
Online marktplaatsen zullen worden getransformeerd door autonome AI-agenten die namens consumenten handelen. In plaats van dat mensen browsen en klikken, kunnen vision-language-model (VLM) agenten webpagina's interpreteren, producten evalueren en transacties uitvoeren. Dit roept een fundamentele vraag op: wat kopen AI-agenten, en waarom? We ontwikkelen ACES, een sandbox-omgeving die een platform-onafhankelijke VLM-agent koppelt aan een volledig programmeerbare mock-marktplaats om deze vraag te bestuderen. We voeren eerst basisrationaliteitstests uit in de context van eenvoudige taken, en vervolgens, door productposities, prijzen, beoordelingen, reviews, gesponsorde tags en platformaanbevelingen te randomiseren, verkrijgen we causale schattingen van hoe frontier VLM's daadwerkelijk winkelen. Modellen tonen sterke maar heterogene positie-effecten: allemaal geven ze de voorkeur aan de bovenste rij, maar verschillende modellen prefereren verschillende kolommen, wat de aanname van een universele "top"-rang ondermijnt. Ze straffen gesponsorde tags en belonen aanbevelingen. De gevoeligheden voor prijs, beoordelingen en reviews zijn richtingsgewijs mensachtig, maar variëren sterk in omvang tussen modellen. Gemotiveerd door scenario's waarin verkopers AI-agenten gebruiken om productvermeldingen te optimaliseren, tonen we aan dat een verkoperszijde-agent die kleine aanpassingen maakt aan productbeschrijvingen, gericht op AI-kopersvoorkeuren, aanzienlijke marktaandeelwinsten kan opleveren als AI-gemedieerd winkelen domineert. We vinden ook dat modale productkeuzes kunnen verschillen tussen modellen en dat in sommige gevallen de vraag zich kan concentreren op een paar geselecteerde producten, wat concurrentievragen oproept. Samen belichten onze resultaten hoe AI-agenten zich kunnen gedragen in e-commerce settings en brengen ze concrete verkopersstrategieën, platformontwerp en regelgevingsvragen naar voren in een AI-gemedieerd ecosysteem.
English
Online marketplaces will be transformed by autonomous AI agents acting on
behalf of consumers. Rather than humans browsing and clicking,
vision-language-model (VLM) agents can parse webpages, evaluate products, and
transact. This raises a fundamental question: what do AI agents buy, and why?
We develop ACES, a sandbox environment that pairs a platform-agnostic VLM agent
with a fully programmable mock marketplace to study this question. We first
conduct basic rationality checks in the context of simple tasks, and then, by
randomizing product positions, prices, ratings, reviews, sponsored tags, and
platform endorsements, we obtain causal estimates of how frontier VLMs actually
shop. Models show strong but heterogeneous position effects: all favor the top
row, yet different models prefer different columns, undermining the assumption
of a universal "top" rank. They penalize sponsored tags and reward
endorsements. Sensitivities to price, ratings, and reviews are directionally
human-like but vary sharply in magnitude across models. Motivated by scenarios
where sellers use AI agents to optimize product listings, we show that a
seller-side agent that makes minor tweaks to product descriptions, targeting AI
buyer preferences, can deliver substantial market-share gains if AI-mediated
shopping dominates. We also find that modal product choices can differ across
models and, in some cases, demand may concentrate on a few select products,
raising competition questions. Together, our results illuminate how AI agents
may behave in e-commerce settings and surface concrete seller strategy,
platform design, and regulatory questions in an AI-mediated ecosystem.