AgentSocialBench : Évaluation des risques liés à la vie privée dans les réseaux sociaux agentiques centrés sur l'humain

Résumé

Avec l'émergence de cadres d'agents LLM persistants et personnalisés tels qu'OpenClaw, les réseaux sociaux agentiques centrés sur l'humain, dans lesquels des équipes d'agents IA collaboratifs servent des utilisateurs individuels au sein d'un réseau social sur de multiples domaines, deviennent une réalité. Ce contexte génère de nouveaux défis en matière de vie privée : les agents doivent coordonner leurs actions au-delà des frontières des domaines, servir de médiateurs entre les humains et interagir avec les agents d'autres utilisateurs, tout en protégeant des informations personnelles sensibles. Si les travaux antérieurs ont évalué la coordination multi-agents et la préservation de la vie privée, les dynamiques et les risques liés à la confidentialité dans les réseaux sociaux agentiques centrés sur l'humain demeurent inexplorés. Pour combler cette lacune, nous présentons AgentSocialBench, le premier benchmark conçu pour évaluer systématiquement le risque pour la vie privée dans ce contexte. Il comprend des scénarios répartis en sept catégories couvrant des interactions dyadiques et multipartites, ancrés dans des profils utilisateur réalistes dotés d'étiquettes de sensibilité hiérarchiques et de graphes sociaux orientés. Nos expériences révèlent que la protection de la vie privée dans les réseaux sociaux agentiques est fondamentalement plus difficile que dans les configurations à agent unique : (1) la coordination transdomaine et inter-utilisateurs crée une pression de fuite persistante, même lorsque les agents reçoivent des instructions explicites pour protéger l'information, (2) les instructions de confidentialité qui enseignent aux agents comment abstraire les informations sensibles les amènent paradoxalement à en discuter davantage (nous appelons cela le paradoxe de l'abstraction). Ces résultats soulignent que les agents LLM actuels ne disposent pas de mécanismes robustes pour préserver la vie privée dans les réseaux sociaux agentiques centrés sur l'humain, et que de nouvelles approches dépassant l'ingénierie des prompts sont nécessaires pour rendre la coordination sociale médiée par les agents suffisamment sûre pour un déploiement réel.

English

With the rise of personalized, persistent LLM agent frameworks such as OpenClaw, human-centered agentic social networks in which teams of collaborative AI agents serve individual users in a social network across multiple domains are becoming a reality. This setting creates novel privacy challenges: agents must coordinate across domain boundaries, mediate between humans, and interact with other users' agents, all while protecting sensitive personal information. While prior work has evaluated multi-agent coordination and privacy preservation, the dynamics and privacy risks of human-centered agentic social networks remain unexplored. To this end, we introduce AgentSocialBench, the first benchmark to systematically evaluate privacy risk in this setting, comprising scenarios across seven categories spanning dyadic and multi-party interactions, grounded in realistic user profiles with hierarchical sensitivity labels and directed social graphs. Our experiments reveal that privacy in agentic social networks is fundamentally harder than in single-agent settings: (1) cross-domain and cross-user coordination creates persistent leakage pressure even when agents are explicitly instructed to protect information, (2) privacy instructions that teach agents how to abstract sensitive information paradoxically cause them to discuss it more (we call it abstraction paradox). These findings underscore that current LLM agents lack robust mechanisms for privacy preservation in human-centered agentic social networks, and that new approaches beyond prompt engineering are needed to make agent-mediated social coordination safe for real-world deployment.

AgentSocialBench : Évaluation des risques liés à la vie privée dans les réseaux sociaux agentiques centrés sur l'humain

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

Résumé

Support