ChatPaper.aiChatPaper

ClawKeeper : Protection de sécurité complète pour les agents OpenClaw via les compétences, les plugins et les surveillants

ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

March 25, 2026
Auteurs: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI

Résumé

OpenClaw s'est rapidement imposé comme un environnement d'exécution autonome open-source de premier plan, offrant des capacités puissantes incluant l'intégration d'outils, l'accès aux fichiers locaux et l'exécution de commandes shell. Cependant, ces privilèges opérationnels étendus introduisent des vulnérabilités de sécurité critiques, transformant les erreurs de modèle en menaces tangibles au niveau du système, telles que la fuite de données sensibles, l'élévation de privilèges et l'exécution de compétences tierces malveillantes. Les mesures de sécurité existantes pour l'écosystème OpenClaw restent très fragmentées, ne couvrant que des étapes isolées du cycle de vie de l'agent plutôt que de fournir une protection holistique. Pour combler cette lacune, nous présentons ClawKeeper, un cadre de sécurité en temps réel qui intègre des mécanismes de protection multidimensionnels à travers trois couches architecturales complémentaires. (1) La protection basée sur les compétences opère au niveau de l'instruction, injectant des politiques de sécurité structurées directement dans le contexte de l'agent pour imposer des contraintes spécifiques à l'environnement et traverser les limites des plateformes. (2) La protection basée sur les plugins agit comme un agent d'exécution interne, fournissant un durcissement de la configuration, une détection proactive des menaces et une surveillance comportementale continue tout au long du pipeline d'exécution. (3) La protection basée sur les observateurs introduit un middleware de sécurité novateur et découplé au niveau du système, qui vérifie continuellement l'évolution de l'état de l'agent. Il permet une intervention d'exécution en temps réel sans couplage avec la logique interne de l'agent, supportant des opérations telles que l'interruption d'actions à haut risque ou l'imposition d'une confirmation humaine. Nous soutenons que ce paradigme d'observateur présente un fort potentiel pour servir de brique fondamentale pour sécuriser les systèmes d'agents autonomes de nouvelle génération. Des évaluations qualitatives et quantitatives approfondies démontrent l'efficacité et la robustesse de ClawKeeper dans divers scénarios de menaces. Nous publions notre code.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.
PDF1662April 3, 2026