ClawKeeper: Uitgebreide Veiligheidsbescherming voor OpenClaw-Agenten via Vaardigheden, Plug-ins en Bewakers
ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
March 25, 2026
Auteurs: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI
Samenvatting
OpenClaw heeft zich snel gevestigd als een toonaangevende open-source runtime voor autonome agents, met krachtige mogelijkheden zoals toolintegratie, lokale bestandstoegang en de uitvoering van shell-commando's. Deze brede operationele privileges introduceren echter kritieke beveiligingslekken, waardoor modelfouten kunnen transformeren in tastbare systeemniveau-bedreigingen, zoals het lekken van gevoelige gegevens, escalatie van privileges en de uitvoering van kwaadaardige third-party skills. Bestaande beveiligingsmaatregelen voor het OpenClaw-ecosysteem zijn sterk gefragmenteerd en behandelen slechts geïsoleerde fasen van de agent-lifecycle in plaats van holistische bescherming te bieden. Om deze kloof te overbruggen, presenteren we ClawKeeper, een realtime beveiligingsframework dat multidimensionale beschermingsmechanismen integreert over drie complementaire architectuurlagen. (1) Skill-gebaseerde bescherming opereert op instructieniveau en injecteert gestructureerd beveiligingsbeleid direct in de agentcontext om omgevingsspecifieke beperkingen en cross-platform grenzen af te dwingen. (2) Plugin-gebaseerde bescherming fungeert als een interne runtime-handhaver, biedt configuratieverharding, proactieve dreigingsdetectie en continue gedragsmonitoring gedurende de gehele uitvoeringspijplijn. (3) Watcher-gebaseerde bescherming introduceert een nieuw, ontkoppeld systeemniveau beveiligingsmiddelware dat continu de statusontwikkeling van de agent verifieert. Het maakt realtime interventie tijdens uitvoering mogelijk zonder koppeling aan de interne logica van de agent, en ondersteunt operaties zoals het stoppen van hoogrisico-acties of het afdwingen van menselijke bevestiging. Wij stellen dat dit Watcher-paradigma een sterk potentieel heeft om als fundamenteel bouwblok te dienen voor het beveiligen van autonome agentsystemen van de volgende generatie. Uitgebreide kwalitatieve en kwantitatieve evaluaties tonen de effectiviteit en robuustheid van ClawKeeper aan in diverse dreigingsscenario's. Wij geven onze code vrij.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.