Was kauft Ihr KI-Agent? Bewertung, Implikationen und aufkommende Fragen für agentenbasiertes E-Commerce
What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce
August 4, 2025
papers.authors: Amine Allouah, Omar Besbes, Josué D Figueroa, Yash Kanoria, Akshit Kumar
cs.AI
papers.abstract
Online-Marktplätze werden durch autonome KI-Agenten, die im Namen der Verbraucher handeln, transformiert werden. Anstatt dass Menschen durch Seiten browsen und klicken, können Vision-Language-Model (VLM)-Agenten Webseiten analysieren, Produkte bewerten und Transaktionen durchführen. Dies wirft eine grundlegende Frage auf: Was kaufen KI-Agenten und warum? Wir entwickeln ACES, eine Sandbox-Umgebung, die einen plattformunabhängigen VLM-Agenten mit einem vollständig programmierbaren Mock-Marktplatz kombiniert, um diese Frage zu untersuchen. Zunächst führen wir grundlegende Rationalitätsprüfungen im Kontext einfacher Aufgaben durch und erhalten dann durch die Randomisierung von Produktpositionen, Preisen, Bewertungen, Rezensionen, gesponserten Tags und Plattformempfehlungen kausale Schätzungen, wie fortschrittliche VLMs tatsächlich einkaufen. Modelle zeigen starke, aber heterogene Positionseffekte: Alle bevorzugen die oberste Reihe, doch verschiedene Modelle bevorzugen unterschiedliche Spalten, was die Annahme eines universellen „Top“-Rangs untergräbt. Sie bestrafen gesponserte Tags und belohnen Empfehlungen. Die Sensitivitäten gegenüber Preis, Bewertungen und Rezensionen sind in der Richtung menschenähnlich, variieren jedoch stark in der Größenordnung zwischen den Modellen. Motiviert durch Szenarien, in denen Verkäufer KI-Agenten zur Optimierung von Produktlisten verwenden, zeigen wir, dass ein verkäuferseitiger Agent, der geringfügige Anpassungen an Produktbeschreibungen vornimmt und die Präferenzen von KI-Käufern anzielt, erhebliche Marktanteilsgewinne erzielen kann, wenn KI-vermitteltes Einkaufen dominiert. Wir stellen auch fest, dass die modalen Produktauswahlmöglichkeiten zwischen den Modellen variieren können und in einigen Fällen die Nachfrage auf einige wenige ausgewählte Produkte konzentriert sein kann, was Wettbewerbsfragen aufwirft. Zusammen beleuchten unsere Ergebnisse, wie sich KI-Agenten in E-Commerce-Szenarien verhalten können, und werfen konkrete Fragen zu Verkäuferstrategien, Plattformdesign und Regulierung in einem KI-vermittelten Ökosystem auf.
English
Online marketplaces will be transformed by autonomous AI agents acting on
behalf of consumers. Rather than humans browsing and clicking,
vision-language-model (VLM) agents can parse webpages, evaluate products, and
transact. This raises a fundamental question: what do AI agents buy, and why?
We develop ACES, a sandbox environment that pairs a platform-agnostic VLM agent
with a fully programmable mock marketplace to study this question. We first
conduct basic rationality checks in the context of simple tasks, and then, by
randomizing product positions, prices, ratings, reviews, sponsored tags, and
platform endorsements, we obtain causal estimates of how frontier VLMs actually
shop. Models show strong but heterogeneous position effects: all favor the top
row, yet different models prefer different columns, undermining the assumption
of a universal "top" rank. They penalize sponsored tags and reward
endorsements. Sensitivities to price, ratings, and reviews are directionally
human-like but vary sharply in magnitude across models. Motivated by scenarios
where sellers use AI agents to optimize product listings, we show that a
seller-side agent that makes minor tweaks to product descriptions, targeting AI
buyer preferences, can deliver substantial market-share gains if AI-mediated
shopping dominates. We also find that modal product choices can differ across
models and, in some cases, demand may concentrate on a few select products,
raising competition questions. Together, our results illuminate how AI agents
may behave in e-commerce settings and surface concrete seller strategy,
platform design, and regulatory questions in an AI-mediated ecosystem.