SPILLage : Le partage excessif agentique sur le Web

papers.abstract

Les agents pilotés par LLM commencent à automatiser les tâches des utilisateurs sur le web ouvert, souvent avec un accès à leurs ressources telles que les e-mails et les agendas. Contrairement aux LLM standards qui répondent à des questions dans un environnement de chatbot contrôlé, les agents web agissent « en milieu naturel », interagissant avec des tiers et laissant derrière eux une trace d'actions. Par conséquent, nous posons la question suivante : comment les agents web gèrent-ils les ressources des utilisateurs lorsqu'ils accomplissent des tâches en leur nom sur des sites web en direct ? Dans cet article, nous formalisons le *Natural Agentic Oversharing* – la divulgation non intentionnelle d'informations utilisateur non pertinentes pour la tâche via une trace d'actions de l'agent sur le web. Nous présentons SPILLage, un cadre qui caractérise le partage excessif selon deux dimensions : le canal (contenu vs comportement) et le caractère direct (explicite vs implicite). Cette taxonomie révèle un angle mort critique : alors que les travaux antérieurs se concentrent sur les fuites de texte, les agents web divulguent également des informations par leur comportement via des clics, défilements et motifs de navigation qui peuvent être surveillés. Nous évaluons 180 tâches sur des sites e-commerce en direct avec des annotations de vérité terrain séparant les attributs pertinents des attributs non pertinents pour la tâche. Sur 1 080 exécutions couvrant deux frameworks agentiques et trois LLMs de base, nous démontrons que le partage excessif est omniprésent, le partage comportemental dominant le partage de contenu par un facteur de 5. Cet effet persiste – et peut même s'aggraver – avec des atténuations au niveau de l'invite. Cependant, supprimer les informations non pertinentes avant l'exécution améliore le succès des tâches jusqu'à 17,9 %, démontrant que réduire le partage excessif améliore les performances. Nos résultats soulignent que la protection de la vie privée dans les agents web est un défi fondamental, nécessitant une vision élargie de la « sortie » qui tient compte de ce que les agents *font* sur le web, et pas seulement de ce qu'ils *tapent*. Nos jeux de données et notre code sont disponibles à l'adresse https://github.com/jrohsc/SPILLage.

English

LLM-powered agents are beginning to automate user's tasks across the open web, often with access to user resources such as emails and calendars. Unlike standard LLMs answering questions in a controlled ChatBot setting, web agents act "in the wild", interacting with third parties and leaving behind an action trace. Therefore, we ask the question: how do web agents handle user resources when accomplishing tasks on their behalf across live websites? In this paper, we formalize Natural Agentic Oversharing -- the unintentional disclosure of task-irrelevant user information through an agent trace of actions on the web. We introduce SPILLage, a framework that characterizes oversharing along two dimensions: channel (content vs. behavior) and directness (explicit vs. implicit). This taxonomy reveals a critical blind spot: while prior work focuses on text leakage, web agents also overshare behaviorally through clicks, scrolls, and navigation patterns that can be monitored. We benchmark 180 tasks on live e-commerce sites with ground-truth annotations separating task-relevant from task-irrelevant attributes. Across 1,080 runs spanning two agentic frameworks and three backbone LLMs, we demonstrate that oversharing is pervasive with behavioral oversharing dominates content oversharing by 5x. This effect persists -- and can even worsen -- under prompt-level mitigation. However, removing task-irrelevant information before execution improves task success by up to 17.9%, demonstrating that reducing oversharing improves task success. Our findings underscore that protecting privacy in web agents is a fundamental challenge, requiring a broader view of "output" that accounts for what agents do on the web, not just what they type. Our datasets and code are available at https://github.com/jrohsc/SPILLage.

SPILLage : Le partage excessif agentique sur le Web

SPILLage: Agentic Oversharing on the Web

papers.abstract

Support