ChatPaper.aiChatPaper

HarmonyGuard : Vers la sécurité et l'utilité des agents web grâce à l'amélioration adaptative des politiques et à l'optimisation à double objectif

HarmonyGuard: Toward Safety and Utility in Web Agents via Adaptive Policy Enhancement and Dual-Objective Optimization

August 6, 2025
papers.authors: Yurun Chen, Xavier Hu, Yuhan Liu, Keting Yin, Juncheng Li, Zhuosheng Zhang, Shengyu Zhang
cs.AI

papers.abstract

Les grands modèles de langage permettent aux agents d'exécuter des tâches de manière autonome dans des environnements web ouverts. Cependant, à mesure que les menaces cachées sur le web évoluent, les agents web sont confrontés au défi d'équilibrer la performance des tâches avec les risques émergents lors d'opérations à longues séquences. Bien que ce défi soit crucial, les recherches actuelles se limitent à l'optimisation mono-objectif ou à des scénarios en un seul tour, manquant ainsi de la capacité d'optimisation collaborative de la sécurité et de l'utilité dans les environnements web. Pour combler cette lacune, nous proposons HarmonyGuard, un cadre collaboratif multi-agents qui exploite l'amélioration des politiques et l'optimisation des objectifs pour améliorer conjointement l'utilité et la sécurité. HarmonyGuard se caractérise par une architecture multi-agents dotée de deux capacités fondamentales : (1) Amélioration Adaptative des Politiques : Nous introduisons l'Agent de Politique au sein de HarmonyGuard, qui extrait et maintient automatiquement des politiques de sécurité structurées à partir de documents externes non structurés, tout en mettant à jour continuellement les politiques en réponse aux menaces évolutives. (2) Optimisation Duale des Objectifs : Basée sur les deux objectifs de sécurité et d'utilité, l'Agent d'Utilité intégré dans HarmonyGuard effectue un raisonnement en temps réel de type Markovien pour évaluer les objectifs et utilise des capacités métacognitives pour leur optimisation. Des évaluations approfondies sur plusieurs benchmarks montrent que HarmonyGuard améliore la conformité aux politiques jusqu'à 38 % et la réalisation des tâches jusqu'à 20 % par rapport aux bases de référence existantes, tout en atteignant plus de 90 % de conformité aux politiques pour toutes les tâches. Notre projet est disponible ici : https://github.com/YurunChen/HarmonyGuard.
English
Large language models enable agents to autonomously perform tasks in open web environments. However, as hidden threats within the web evolve, web agents face the challenge of balancing task performance with emerging risks during long-sequence operations. Although this challenge is critical, current research remains limited to single-objective optimization or single-turn scenarios, lacking the capability for collaborative optimization of both safety and utility in web environments. To address this gap, we propose HarmonyGuard, a multi-agent collaborative framework that leverages policy enhancement and objective optimization to jointly improve both utility and safety. HarmonyGuard features a multi-agent architecture characterized by two fundamental capabilities: (1) Adaptive Policy Enhancement: We introduce the Policy Agent within HarmonyGuard, which automatically extracts and maintains structured security policies from unstructured external documents, while continuously updating policies in response to evolving threats. (2) Dual-Objective Optimization: Based on the dual objectives of safety and utility, the Utility Agent integrated within HarmonyGuard performs the Markovian real-time reasoning to evaluate the objectives and utilizes metacognitive capabilities for their optimization. Extensive evaluations on multiple benchmarks show that HarmonyGuard improves policy compliance by up to 38% and task completion by up to 20% over existing baselines, while achieving over 90% policy compliance across all tasks. Our project is available here: https://github.com/YurunChen/HarmonyGuard.
PDF82August 7, 2025